當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R readr encoding 猜測文件的編碼


使用 stringi::stri_enc_detect() :請參閱那裏的文檔以了解注意事項。

用法

guess_encoding(file, n_max = 10000, threshold = 0.2)

參數

file

指定 datasource() 中指定的輸入的字符串、原始向量或原始向量列表。

n_max

要讀取的行數。如果n_max為-1,則將讀取文件中的所有行。

threshold

僅報告高於此確定性閾值的猜測。

一點點

例子

guess_encoding(readr_example("mtcars.csv"))
#> # A tibble: 1 × 2
#>   encoding confidence
#>   <chr>         <dbl>
#> 1 ASCII             1
guess_encoding(read_lines_raw(readr_example("mtcars.csv")))
#> # A tibble: 1 × 2
#>   encoding confidence
#>   <chr>         <dbl>
#> 1 ASCII             1
guess_encoding(read_file_raw(readr_example("mtcars.csv")))
#> # A tibble: 1 × 2
#>   encoding confidence
#>   <chr>         <dbl>
#> 1 ASCII             1

guess_encoding("a\n\u00b5\u00b5")
#> # A tibble: 1 × 2
#>   encoding confidence
#>   <chr>         <dbl>
#> 1 UTF-8           0.8
源代碼:R/encoding.R

相關用法


注:本文由純淨天空篩選整理自Hadley Wickham等大神的英文原創作品 Guess encoding of file。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。