本文简要介绍python语言中 torchtext.vocab.build_vocab_from_iterator
的用法。
用法:
torchtext.vocab.build_vocab_from_iterator(iterator: Iterable, min_freq: int = 1, specials: Optional[List[str]] = None, special_first: bool = True) → torchtext.vocab.vocab.Vocab
iterator-用于构建 Vocab 的迭代器。必须产生令牌列表或迭代器。
min_freq-在词汇表中包含标记所需的最小频率。
specials-要添加的特殊符号。提供的令牌的顺序将被保留。
special_first-指示是在开头还是结尾插入符号。
Vocab
对象从迭代器构建词汇。
例子
>>> #generating vocab from text file >>> import io >>> from torchtext.vocab import build_vocab_from_iterator >>> def yield_tokens(file_path): >>> with io.open(file_path, encoding = 'utf-8') as f: >>> for line in f: >>> yield line.strip().split() >>> vocab = build_vocab_from_iterator(yield_tokens_batch(file_path), specials=["<unk>"])
参数:
返回:
返回类型:
相关用法
- Python PyTorch bucketize用法及代码示例
- Python PyTorch bincount用法及代码示例
- Python PyTorch bitwise_right_shift用法及代码示例
- Python PyTorch bernoulli用法及代码示例
- Python PyTorch bitwise_and用法及代码示例
- Python PyTorch bitwise_not用法及代码示例
- Python PyTorch backward用法及代码示例
- Python PyTorch batched_powerSGD_hook用法及代码示例
- Python PyTorch binary_cross_entropy用法及代码示例
- Python PyTorch bitwise_xor用法及代码示例
- Python PyTorch binary_cross_entropy_with_logits用法及代码示例
- Python PyTorch bleu_score用法及代码示例
- Python PyTorch broadcast_tensors用法及代码示例
- Python PyTorch broadcast_object_list用法及代码示例
- Python PyTorch broadcast_shapes用法及代码示例
- Python PyTorch bitwise_or用法及代码示例
- Python PyTorch bitwise_left_shift用法及代码示例
- Python PyTorch bf16_compress_wrapper用法及代码示例
- Python PyTorch bmm用法及代码示例
- Python PyTorch baddbmm用法及代码示例
- Python PyTorch broadcast_to用法及代码示例
- Python PyTorch bf16_compress_hook用法及代码示例
- Python PyTorch block_diag用法及代码示例
- Python PyTorch frexp用法及代码示例
- Python PyTorch jvp用法及代码示例
注:本文由纯净天空筛选整理自pytorch.org大神的英文原创作品 torchtext.vocab.build_vocab_from_iterator。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。