本文整理匯總了Python中Dictionary.Dictionary.doc2bow方法的典型用法代碼示例。如果您正苦於以下問題:Python Dictionary.doc2bow方法的具體用法?Python Dictionary.doc2bow怎麽用?Python Dictionary.doc2bow使用的例子?那麽, 這裏精選的方法代碼示例或許可以為您提供幫助。您也可以進一步了解該方法所在類Dictionary.Dictionary
的用法示例。
在下文中一共展示了Dictionary.doc2bow方法的1個代碼示例,這些例子默認根據受歡迎程度排序。您可以為喜歡或者感覺有用的代碼點讚,您的評價將有助於係統推薦出更棒的Python代碼示例。
示例1: main
# 需要導入模塊: from Dictionary import Dictionary [as 別名]
# 或者: from Dictionary.Dictionary import doc2bow [as 別名]
def main():
path = "/path/to/corpus"
# コーパスの読み込み
# 前処理
documents = []
for filename in os.listdir(path):
document = open(os.path.join(path, filename)).read().strip()
document = preprocess(document)
documents.append(document)
# 辭書を作成
# 低頻度すぎるもの, 高頻度すぎる単語は除去
dictionary = Dictionary(documents)
dictionary.filter_extremes(no_below=3, no_above=0.6)
# 辭書の保存
dictionary.save("id2word.txt")
# vocabulary の表示
vocabulary = dictionary.get_vocabulary()
print vocabulary, "(%d words)" % len(vocabulary)
# 特徴量(BoWベクトル)への変換
for document in documents:
bowvec = dictionary.doc2bow(document)