本文简要介绍python语言中 torchtext.data.functional.sentencepiece_tokenizer
的用法。
用法:
torchtext.data.functional.sentencepiece_tokenizer(sp_model)
sp_model-SentencePiece 模型。
- 将文本句子标记为的句子模型
令牌上的生成器。
- 输出:
- 输出:一个生成器,输入为文本句子,输出为
基于SentencePiece模型的相应令牌。
例子
>>> from torchtext.data.functional import sentencepiece_tokenizer >>> sp_tokens_generator = sentencepiece_tokenizer(sp_model) >>> list_a = ["sentencepiece encode as pieces", "examples to try!"] >>> list(sp_tokens_generator(list_a)) [['_sentence', 'piece', '_en', 'co', 'de', '_as', '_pieces'], ['_example', 's', '_to', '_try', '!']]
参数:
相关用法
- Python PyTorch sentencepiece_numericalizer用法及代码示例
- Python PyTorch set_flush_denormal用法及代码示例
- Python PyTorch set_default_dtype用法及代码示例
- Python PyTorch set_grad_enabled用法及代码示例
- Python PyTorch set_default_tensor_type用法及代码示例
- Python PyTorch searchsorted用法及代码示例
- Python PyTorch saved_tensors_hooks用法及代码示例
- Python PyTorch sqrt用法及代码示例
- Python PyTorch skippable用法及代码示例
- Python PyTorch squeeze用法及代码示例
- Python PyTorch square用法及代码示例
- Python PyTorch save_on_cpu用法及代码示例
- Python PyTorch scatter_object_list用法及代码示例
- Python PyTorch skip_init用法及代码示例
- Python PyTorch simple_space_split用法及代码示例
- Python PyTorch sum用法及代码示例
- Python PyTorch sub用法及代码示例
- Python PyTorch sparse_csr_tensor用法及代码示例
- Python PyTorch symeig用法及代码示例
- Python PyTorch sinh用法及代码示例
- Python PyTorch sinc用法及代码示例
- Python PyTorch std_mean用法及代码示例
- Python PyTorch spectral_norm用法及代码示例
- Python PyTorch slogdet用法及代码示例
- Python PyTorch symbolic_trace用法及代码示例
注:本文由纯净天空筛选整理自pytorch.org大神的英文原创作品 torchtext.data.functional.sentencepiece_tokenizer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。