当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Ruby String.unicode_normalize用法及代码示例


本文简要介绍ruby语言中 String.unicode_normalize 的用法。

用法

unicode_normalize(form=:nfc)

Unicode 规范化 - 返回规范化形式的 str ,使用 Unicode 规范化 NFC、NFD、NFKC 或 NFKD。使用的规范化形式由 form 确定,它可以是四个值中的任何一个 :nfc:nfd:nfkc:nfkd 。默认值为 :nfc

如果字符串不在 Unicode Encoding 中,则引发 Exception 。在此上下文中,“Unicode 编码”是指 UTF-8、UTF-16BE/LE 和 UTF-32BE/LE 以及 GB18030、UCS_2BE 和 UCS_4BE 中的任何一种。 UTF-8 以外的任何东西都是通过转换为 UTF-8 来实现的,这使得它比 UTF-8 慢。

"a\u0300".unicode_normalize        #=> "\u00E0"
"a\u0300".unicode_normalize(:nfc)  #=> "\u00E0"
"\u00E0".unicode_normalize(:nfd)   #=> "a\u0300"
"\xE0".force_encoding('ISO-8859-1').unicode_normalize(:nfd)
                                   #=> Encoding::CompatibilityError raised

相关用法


注:本文由纯净天空筛选整理自ruby-lang.org大神的英文原创作品 String.unicode_normalize。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。