R语言
charsets
位于 tools
包(package)。 说明
charset_to_Unicode
是一个 Unicode 代码点矩阵,其中包含常见 8 位编码的列。
Adobe_glyphs
是一个 DataFrame ,它为 Unicode 代码点提供 Adobe 字形名称。它有两个字符列:"adobe"
和"unicode"
(4 位十六进制表示形式)。
用法
charset_to_Unicode
Adobe_glyphs
细节
charset_to_Unicode
是类 c("noquote", "hexmode")
的整数矩阵,因此以十六进制打印。这些映射是 libiconv
使用的映射:源之间的引号和减号/连字符映射方式存在差异(并且 postscript 编码文件使用不同的映射)。
Adobe_glyphs
包括与单个 Unicode 字符相对应的所有 Adobe 字形名称。它按 Unicode 代码点排序,并在字形上的一个点内按字母顺序排序(Unicode 代码点可以有多个名称)。数据位于文件‘base Rhome/分享/编码/Adobe_glyphlist’。
例子
## find Adobe names for ISOLatin2 chars.
latin2 <- charset_to_Unicode[, "ISOLatin2"]
aUnicode <- as.hexmode(paste0("0x", Adobe_glyphs$unicode))
keep <- aUnicode %in% latin2
aUnicode <- aUnicode[keep]
aAdobe <- Adobe_glyphs[keep, 1]
## first match
aLatin2 <- aAdobe[match(latin2, aUnicode)]
## all matches
bLatin2 <- lapply(1:256, function(x) aAdobe[aUnicode == latin2[x]])
format(bLatin2, justify = "none")
相关用法
- R checkVignettes 检查包装插图
- R checkMD5sums 检查并创建 MD5 校验和文件
- R checkFF 检查外部函数调用
- R checkTnF 检查 R 包或 T/F 代码
- R checkRdaFiles 报告已保存图像的详细信息或重新保存它们
- R checkRd 检查 Rd 对象
- R checkPoFiles 检查翻译文件中格式字符串不一致的情况
- R check_packages_in_dir 检查源码包及其反向依赖
- R codoc 检查代码/文档的一致性
- R compactPDF 压缩 PDF 文件
- R update_PACKAGES 更新现有的 PACKAGES 文件
- R print.via.format 打印实用程序
- R prepare_Rd 准备用于渲染的解析 Rd 对象
- R startDynamicHelp 启动动态 HTML 帮助系统
- R getVignetteInfo 获取有关已安装 Vignettes 的信息
- R matchConcordance 源行和目标行之间的一致性
- R Rd2HTML 路转换器
- R HTMLheader 为 R 帮助生成标准 HTML 标头
- R undoc 查找未记录的对象
- R vignetteInfo 有关晕影的基本信息
- R HTMLlinks 从包文档收集 HTML 链接
- R xgettext 从包中的 R 文件中提取可翻译消息
- R toTitleCase 将标题转换为标题大小写
- R package_native_routine_registration_skeleton 编写用于将本机例程注册添加到包的框架
- R parse_Rd 解析 Rd 文件
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Conversion Tables between Character Sets。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。