本文整理汇总了Python中gensim.corpora.WikiCorpus.load方法的典型用法代码示例。如果您正苦于以下问题:Python WikiCorpus.load方法的具体用法?Python WikiCorpus.load怎么用?Python WikiCorpus.load使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类gensim.corpora.WikiCorpus
的用法示例。
在下文中一共展示了WikiCorpus.load方法的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。
示例1: corpus
# 需要导入模块: from gensim.corpora import WikiCorpus [as 别名]
# 或者: from gensim.corpora.WikiCorpus import load [as 别名]
# SETTINGS
# model parameters and output
lsa_dim = 100
w2v_dim = 50
f_bow = "{0}.bow".format(prefix)
f_tfidf = "{0}_voc{1}.tfidf".format(prefix, voc_size)
f_lsa = "{0}_voc{1}_dim{2}.lsa".format(prefix, voc_size, lsa_dim)
f_dict = "{0}_voc{1}.dict".format(prefix, voc_size)
f_w2v = "{0}_voc{1}_dim{2}_win5.bin".format(prefix, voc_size, w2v_dim)
# CORPUS PREPROCESSING
if wiki: # models will be trained on the Dutch Wikipedia corpus
if os.path.exists(f_bow):
corpus = WikiCorpus.load(f_bow)
else:
# download wikipedia training corpus (2015/10/14 18:45, 132MB)
if not os.path.exists(f_corpus):
wiki_lang, wiki_size, wiki_url = wikis[lang]
if raw_input("About to download {0} Wikipedia corpus ({1}). Do you want to proceed? (y/n) ".format(wiki_lang, wiki_size)).startswith("y"):
util.download_file(wiki_url, f_corpus, progress=True)
else:
sys.exit()
corpus = WikiCorpus(f_corpus)
# corpus.save(f_bow)
else: # models will be trained on your own corpus
if os.path.exists(f_bow):
corpus = TextCorpus.load(f_bow)
else:
corpus = TextCorpus(f_corpus)