tokenization
共有10个方法/函数/属性,点击链接查看相应的源代码示例。
1. tokenization.FullTokenizer() ,72个项目使用
2. tokenization.printable_text() ,61个项目使用
3. tokenization.convert_to_unicode() ,60个项目使用
4. tokenization.BasicTokenizer() ,45个项目使用
5. tokenization.WordpieceTokenizer() ,35个项目使用
6. tokenization._is_control() ,35个项目使用
7. tokenization._is_punctuation() ,35个项目使用
8. tokenization._is_whitespace() ,35个项目使用
9. tokenization.convert_tokens_to_ids() ,34个项目使用
10. tokenization.validate_case_matches_checkpoint() ,32个项目使用
注:本文中的示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。