R localeToCharset 從區域設置名稱中選擇合適的編碼名稱

R語言 localeToCharset 位於 utils 包(package)。

此函數旨在為指定的語言環境找到合適的編碼，默認情況下為當前語言環境，如果是 UTF-8 語言環境，則為合適的單字節編碼。

localeToCharset(locale = Sys.getlocale("LC_CTYPE"))

locale

命名區域設置的字符串。

操作因操作係統而異。

在 Windows 上，: 語言環境指定為 "English_United Kingdom.1252" 。最後一個組件給出代碼頁，這定義了編碼。
在 Unix 類係統上：: 語言環境名稱通常類似於 es_MX.iso88591 。如果最終組件指示編碼並且它不是utf8，我們隻需要查找等效的編碼名稱。否則，將使用語言(此處為 es )來選擇主要或後備編碼。

在 C 語言環境中，答案將是 "ASCII" 。

命名編碼的字符向量，如果未知，可能還有後備 single-encoding、NA。

編碼名稱是 libiconv 使用的名稱，並且也應該適用於 glibc 但可能不適用於商業 Unixen。

localeToCharset()

相關用法

注：本文由純淨天空篩選整理自R-devel大神的英文原創作品 Select a Suitable Encoding Name from a Locale Name。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。