本文整理汇总了Python中gensim.corpora.dictionary.Dictionary.save_as_text方法的典型用法代码示例。如果您正苦于以下问题:Python Dictionary.save_as_text方法的具体用法?Python Dictionary.save_as_text怎么用?Python Dictionary.save_as_text使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类gensim.corpora.dictionary.Dictionary
的用法示例。
在下文中一共展示了Dictionary.save_as_text方法的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。
示例1: main
# 需要导入模块: from gensim.corpora.dictionary import Dictionary [as 别名]
# 或者: from gensim.corpora.dictionary.Dictionary import save_as_text [as 别名]
def main():
parser = ArgumentParser()
parser.add_argument('-d', '--wiki-dump')
parser.add_argument('-l', '--limit', default=None, type=int)
parser.add_argument('-p', '--num-procs', default=1, type=int)
parser.add_argument('-o', '--out', default='vocab')
opts = parser.parse_args()
dump_loc = opts.wiki_dump
limit = opts.limit
n_procs = opts.num_procs
out_fn = opts.out
dump_gen = get_dump_gen(dump_loc, limit=limit, n_procs=n_procs)
nlp = spacy.en.English()
vocab = Dictionary(([token.text.lower().strip() for token in doc if token.text.strip() != ""]
for doc in nlp.pipe((art['article.text'] for art in dump_gen), n_threads=n_procs,
parse=False, tag=False, entity=False)))
vocab.save('%s.vocab' % out_fn)
vocab.save_as_text('%s.txt' % out_fn)