当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R dials vocabulary_size 词汇中的标记数量


用于textrecipes::step_tokenize_sentencepiece()textrecipes::step_tokenize_bpe()

用法

vocabulary_size(range = c(1000L, 32000L), trans = NULL)

参数

range

一个二元素向量,分别保存最小和最大可能值的默认值。如果指定了转换,这些值应采用转换后的单位。

trans

scales 包中的 trans 对象,例如 scales::log10_trans()scales::reciprocal_trans() 。如果未提供,则使用与 range 中使用的单位相匹配的默认值。如果没有转换,NULL

例子

vocabulary_size()
#> # Unique Tokens in Vocabulary (quantitative)
#> Range: [1000, 32000]

相关用法


注:本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Number of tokens in vocabulary。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。