当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R readr encoding 猜测文件的编码


使用 stringi::stri_enc_detect() :请参阅那里的文档以了解注意事项。

用法

guess_encoding(file, n_max = 10000, threshold = 0.2)

参数

file

指定 datasource() 中指定的输入的字符串、原始向量或原始向量列表。

n_max

要读取的行数。如果n_max为-1,则将读取文件中的所有行。

threshold

仅报告高于此确定性阈值的猜测。

一点点

例子

guess_encoding(readr_example("mtcars.csv"))
#> # A tibble: 1 × 2
#>   encoding confidence
#>   <chr>         <dbl>
#> 1 ASCII             1
guess_encoding(read_lines_raw(readr_example("mtcars.csv")))
#> # A tibble: 1 × 2
#>   encoding confidence
#>   <chr>         <dbl>
#> 1 ASCII             1
guess_encoding(read_file_raw(readr_example("mtcars.csv")))
#> # A tibble: 1 × 2
#>   encoding confidence
#>   <chr>         <dbl>
#> 1 ASCII             1

guess_encoding("a\n\u00b5\u00b5")
#> # A tibble: 1 × 2
#>   encoding confidence
#>   <chr>         <dbl>
#> 1 UTF-8           0.8
源代码:R/encoding.R

相关用法


注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Guess encoding of file。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。