當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R dials vocabulary_size 詞匯中的標記數量


用於textrecipes::step_tokenize_sentencepiece()textrecipes::step_tokenize_bpe()

用法

vocabulary_size(range = c(1000L, 32000L), trans = NULL)

參數

range

一個二元素向量,分別保存最小和最大可能值的默認值。如果指定了轉換,這些值應采用轉換後的單位。

trans

scales 包中的 trans 對象,例如 scales::log10_trans()scales::reciprocal_trans() 。如果未提供,則使用與 range 中使用的單位相匹配的默認值。如果沒有轉換,NULL

例子

vocabulary_size()
#> # Unique Tokens in Vocabulary (quantitative)
#> Range: [1000, 32000]

相關用法


注:本文由純淨天空篩選整理自Max Kuhn等大神的英文原創作品 Number of tokens in vocabulary。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。