当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Elixir String.normalize用法及代码示例


Elixir语言中 String.normalize 相关用法介绍如下。

用法:

normalize(string, form)

string 中的所有字符转换为由 form 标识的 Unicode 规范化形式。

跳过无效的 Unicode 代码点并转换字符串的其余部分。如果您希望算法停止并返回无效代码点,请改用 :unicode.characters_to_nfd_binary/1 :unicode.characters_to_nfc_binary/1 :unicode.characters_to_nfkd_binary/1 :unicode.characters_to_nfkc_binary/1

规范化形式:nfkc:nfkd 不应盲目应用于任意文本。因为它们消除了许多格式差异,它们将阻止round-trip 与许多旧字符集之间的转换。

形式

支持的形式有:

  • :nfd - 规范化形式的规范分解。字符通过规范等价分解,多个组合字符按特定顺序排列。

  • :nfc - 规范化形式的规范组合。字符被分解,然后通过规范等价重新组合。

  • :nfkd - 规范化形式兼容性分解。字符通过兼容性等价分解,多个组合字符按特定顺序排列。

  • :nfkc - 规范化表单兼容性组合。字符被分解,然后通过兼容性等价重新组合。

例子

iex> String.normalize("yêṩ", :nfd)
"yêṩ"

iex> String.normalize("leña", :nfc)
"leña"

iex> String.normalize("fi", :nfkd)
"fi"

iex> String.normalize("fi", :nfkc)
"fi"

相关用法


注:本文由纯净天空筛选整理自elixir-lang.org大神的英文原创作品 String.normalize(string, form)。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。