使用 stringi::stri_enc_detect()
:請參閱那裏的文檔以了解注意事項。
參數
- file
-
指定
datasource()
中指定的輸入的字符串、原始向量或原始向量列表。 - n_max
-
要讀取的行數。如果
n_max
為-1,則將讀取文件中的所有行。 - threshold
-
僅報告高於此確定性閾值的猜測。
例子
guess_encoding(readr_example("mtcars.csv"))
#> # A tibble: 1 × 2
#> encoding confidence
#> <chr> <dbl>
#> 1 ASCII 1
guess_encoding(read_lines_raw(readr_example("mtcars.csv")))
#> # A tibble: 1 × 2
#> encoding confidence
#> <chr> <dbl>
#> 1 ASCII 1
guess_encoding(read_file_raw(readr_example("mtcars.csv")))
#> # A tibble: 1 × 2
#> encoding confidence
#> <chr> <dbl>
#> 1 ASCII 1
guess_encoding("a\n\u00b5\u00b5")
#> # A tibble: 1 × 2
#> encoding confidence
#> <chr> <dbl>
#> 1 UTF-8 0.8
相關用法
- R readr edition_get 檢索當前活動版本
- R readr datasource 創建源對象。
- R readr melt_delim 返回分隔文件中每個標記的熔化數據(包括 csv 和 tsv)
- R readr read_rds 讀/寫 RDS 文件。
- R readr read_lines 從文件中讀取/寫入行
- R readr parse_number 靈活地解析數字
- R readr read_fwf 將固定寬度文件讀入 tibble
- R readr read_builtin 從包中讀取內置對象
- R readr Tokenizers 分詞器。
- R readr melt_table 返回空格分隔文件中每個標記的熔化數據
- R readr date_names 創建或檢索日期名稱
- R readr type_convert 重新轉換現有 DataFrame 中的字符列
- R readr locale 創建語言環境
- R readr write_delim 將數據幀寫入分隔文件
- R readr parse_vector 解析字符向量。
- R readr with_edition 暫時更改活動閱讀器版本
- R readr read_delim 將分隔文件(包括 CSV 和 TSV)讀入 tibble
- R readr format_delim 將 DataFrame 轉換為分隔字符串
- R readr readr_example 獲取 readr 示例的路徑
- R readr melt_fwf 返回固定寬度文件中每個標記的熔化數據
- R readr count_fields 計算文件每一行中的字段數
- R readr read_table 將空格分隔的列讀入 tibble
- R readr problems 檢索解析問題
- R readr parse_guess 使用“最佳”類型進行解析
- R readr parse_datetime 解析日期/時間
注:本文由純淨天空篩選整理自Hadley Wickham等大神的英文原創作品 Guess encoding of file。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。