使用 stringi::stri_enc_detect()
:请参阅那里的文档以了解注意事项。
参数
- file
-
指定
datasource()
中指定的输入的字符串、原始向量或原始向量列表。 - n_max
-
要读取的行数。如果
n_max
为-1,则将读取文件中的所有行。 - threshold
-
仅报告高于此确定性阈值的猜测。
例子
guess_encoding(readr_example("mtcars.csv"))
#> # A tibble: 1 × 2
#> encoding confidence
#> <chr> <dbl>
#> 1 ASCII 1
guess_encoding(read_lines_raw(readr_example("mtcars.csv")))
#> # A tibble: 1 × 2
#> encoding confidence
#> <chr> <dbl>
#> 1 ASCII 1
guess_encoding(read_file_raw(readr_example("mtcars.csv")))
#> # A tibble: 1 × 2
#> encoding confidence
#> <chr> <dbl>
#> 1 ASCII 1
guess_encoding("a\n\u00b5\u00b5")
#> # A tibble: 1 × 2
#> encoding confidence
#> <chr> <dbl>
#> 1 UTF-8 0.8
相关用法
- R readr edition_get 检索当前活动版本
- R readr datasource 创建源对象。
- R readr melt_delim 返回分隔文件中每个标记的熔化数据(包括 csv 和 tsv)
- R readr read_rds 读/写 RDS 文件。
- R readr read_lines 从文件中读取/写入行
- R readr parse_number 灵活地解析数字
- R readr read_fwf 将固定宽度文件读入 tibble
- R readr read_builtin 从包中读取内置对象
- R readr Tokenizers 分词器。
- R readr melt_table 返回空格分隔文件中每个标记的熔化数据
- R readr date_names 创建或检索日期名称
- R readr type_convert 重新转换现有 DataFrame 中的字符列
- R readr locale 创建语言环境
- R readr write_delim 将数据帧写入分隔文件
- R readr parse_vector 解析字符向量。
- R readr with_edition 暂时更改活动阅读器版本
- R readr read_delim 将分隔文件(包括 CSV 和 TSV)读入 tibble
- R readr format_delim 将 DataFrame 转换为分隔字符串
- R readr readr_example 获取 readr 示例的路径
- R readr melt_fwf 返回固定宽度文件中每个标记的熔化数据
- R readr count_fields 计算文件每一行中的字段数
- R readr read_table 将空格分隔的列读入 tibble
- R readr problems 检索解析问题
- R readr parse_guess 使用“最佳”类型进行解析
- R readr parse_datetime 解析日期/时间
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Guess encoding of file。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。