當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Ruby String.unicode_normalize用法及代碼示例


本文簡要介紹ruby語言中 String.unicode_normalize 的用法。

用法

unicode_normalize(form=:nfc)

Unicode 規範化 - 返回規範化形式的 str ,使用 Unicode 規範化 NFC、NFD、NFKC 或 NFKD。使用的規範化形式由 form 確定,它可以是四個值中的任何一個 :nfc:nfd:nfkc:nfkd 。默認值為 :nfc

如果字符串不在 Unicode Encoding 中,則引發 Exception 。在此上下文中,“Unicode 編碼”是指 UTF-8、UTF-16BE/LE 和 UTF-32BE/LE 以及 GB18030、UCS_2BE 和 UCS_4BE 中的任何一種。 UTF-8 以外的任何東西都是通過轉換為 UTF-8 來實現的,這使得它比 UTF-8 慢。

"a\u0300".unicode_normalize        #=> "\u00E0"
"a\u0300".unicode_normalize(:nfc)  #=> "\u00E0"
"\u00E0".unicode_normalize(:nfd)   #=> "a\u0300"
"\xE0".force_encoding('ISO-8859-1').unicode_normalize(:nfd)
                                   #=> Encoding::CompatibilityError raised

相關用法


注:本文由純淨天空篩選整理自ruby-lang.org大神的英文原創作品 String.unicode_normalize。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。