本文整理匯總了Python中gensim.corpora.WikiCorpus.load方法的典型用法代碼示例。如果您正苦於以下問題:Python WikiCorpus.load方法的具體用法?Python WikiCorpus.load怎麽用?Python WikiCorpus.load使用的例子?那麽, 這裏精選的方法代碼示例或許可以為您提供幫助。您也可以進一步了解該方法所在類gensim.corpora.WikiCorpus
的用法示例。
在下文中一共展示了WikiCorpus.load方法的1個代碼示例,這些例子默認根據受歡迎程度排序。您可以為喜歡或者感覺有用的代碼點讚,您的評價將有助於係統推薦出更棒的Python代碼示例。
示例1: corpus
# 需要導入模塊: from gensim.corpora import WikiCorpus [as 別名]
# 或者: from gensim.corpora.WikiCorpus import load [as 別名]
# SETTINGS
# model parameters and output
lsa_dim = 100
w2v_dim = 50
f_bow = "{0}.bow".format(prefix)
f_tfidf = "{0}_voc{1}.tfidf".format(prefix, voc_size)
f_lsa = "{0}_voc{1}_dim{2}.lsa".format(prefix, voc_size, lsa_dim)
f_dict = "{0}_voc{1}.dict".format(prefix, voc_size)
f_w2v = "{0}_voc{1}_dim{2}_win5.bin".format(prefix, voc_size, w2v_dim)
# CORPUS PREPROCESSING
if wiki: # models will be trained on the Dutch Wikipedia corpus
if os.path.exists(f_bow):
corpus = WikiCorpus.load(f_bow)
else:
# download wikipedia training corpus (2015/10/14 18:45, 132MB)
if not os.path.exists(f_corpus):
wiki_lang, wiki_size, wiki_url = wikis[lang]
if raw_input("About to download {0} Wikipedia corpus ({1}). Do you want to proceed? (y/n) ".format(wiki_lang, wiki_size)).startswith("y"):
util.download_file(wiki_url, f_corpus, progress=True)
else:
sys.exit()
corpus = WikiCorpus(f_corpus)
# corpus.save(f_bow)
else: # models will be trained on your own corpus
if os.path.exists(f_bow):
corpus = TextCorpus.load(f_bow)
else:
corpus = TextCorpus(f_corpus)