当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R localeToCharset 从区域设置名称中选择合适的编码名称


R语言 localeToCharset 位于 utils 包(package)。

说明

此函数旨在为指定的语言环境找到合适的编码,默认情况下为当前语言环境,如果是 UTF-8 语言环境,则为合适的单字节编码。

用法

localeToCharset(locale = Sys.getlocale("LC_CTYPE"))

参数

locale

命名区域设置的字符串。

细节

操作因操作系统而异。

在 Windows 上,

语言环境指定为 "English_United Kingdom.1252" 。最后一个组件给出代码页,这定义了编码。

在 Unix 类系统上:

语言环境名称通常类似于 es_MX.iso88591 。如果最终组件指示编码并且它不是utf8,我们只需要查找等效的编码名称。否则,将使用语言(此处为 es )来选择主要或后备编码。

C 语言环境中,答案将是 "ASCII"

命名编码的字符向量,如果未知,可能还有后备 single-encoding、NA

注意

编码名称是 libiconv 使用的名称,并且也应该适用于 glibc 但可能不适用于商业 Unixen。

例子

localeToCharset()

也可以看看

Sys.getlocaleiconv

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Select a Suitable Encoding Name from a Locale Name。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。