當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R localeToCharset 從區域設置名稱中選擇合適的編碼名稱


R語言 localeToCharset 位於 utils 包(package)。

說明

此函數旨在為指定的語言環境找到合適的編碼,默認情況下為當前語言環境,如果是 UTF-8 語言環境,則為合適的單字節編碼。

用法

localeToCharset(locale = Sys.getlocale("LC_CTYPE"))

參數

locale

命名區域設置的字符串。

細節

操作因操作係統而異。

在 Windows 上,

語言環境指定為 "English_United Kingdom.1252" 。最後一個組件給出代碼頁,這定義了編碼。

在 Unix 類係統上:

語言環境名稱通常類似於 es_MX.iso88591 。如果最終組件指示編碼並且它不是utf8,我們隻需要查找等效的編碼名稱。否則,將使用語言(此處為 es )來選擇主要或後備編碼。

C 語言環境中,答案將是 "ASCII"

命名編碼的字符向量,如果未知,可能還有後備 single-encoding、NA

注意

編碼名稱是 libiconv 使用的名稱,並且也應該適用於 glibc 但可能不適用於商業 Unixen。

例子

localeToCharset()

也可以看看

Sys.getlocaleiconv

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Select a Suitable Encoding Name from a Locale Name。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。