本文簡要介紹python語言中 torchtext.data.functional.generate_sp_model
的用法。
用法:
torchtext.data.functional.generate_sp_model(filename, vocab_size=20000, model_type='unigram', model_prefix='m_user')
filename-用於訓練SentencePiece模型的數據文件。
vocab_size-詞匯量的大小(默認值:20,000)。
model_type-SentencePiece模型的類型,包括unigram、bpe、char、word。
model_prefix-文件保存模型和詞匯的前綴。
訓練 SentencePiece 分詞器。
- 輸出:
- 模型和詞匯保存在兩個單獨的文件中
model_prefix。
例子
>>> from torchtext.data.functional import generate_sp_model >>> generate_sp_model('test.csv', vocab_size=23456, model_prefix='spm_user')
參數:
相關用法
- Python PyTorch get_tokenizer用法及代碼示例
- Python PyTorch get_gradients用法及代碼示例
- Python PyTorch get_ignored_functions用法及代碼示例
- Python PyTorch get_default_dtype用法及代碼示例
- Python PyTorch get_graph_node_names用法及代碼示例
- Python PyTorch get_testing_overrides用法及代碼示例
- Python PyTorch ge用法及代碼示例
- Python PyTorch gumbel_softmax用法及代碼示例
- Python PyTorch gammainc用法及代碼示例
- Python PyTorch gradient用法及代碼示例
- Python PyTorch gammaincc用法及代碼示例
- Python PyTorch global_unstructured用法及代碼示例
- Python PyTorch greedy_partition用法及代碼示例
- Python PyTorch gammaln用法及代碼示例
- Python PyTorch gt用法及代碼示例
- Python PyTorch gather用法及代碼示例
- Python PyTorch gcd用法及代碼示例
- Python PyTorch gather_object用法及代碼示例
- Python PyTorch frexp用法及代碼示例
- Python PyTorch jvp用法及代碼示例
- Python PyTorch cholesky用法及代碼示例
- Python PyTorch vdot用法及代碼示例
- Python PyTorch ELU用法及代碼示例
- Python PyTorch ScaledDotProduct.__init__用法及代碼示例
- Python PyTorch saved_tensors_hooks用法及代碼示例
注:本文由純淨天空篩選整理自pytorch.org大神的英文原創作品 torchtext.data.functional.generate_sp_model。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。