当前位置: 首页>>代码示例>>Python>>正文


Python Dictionary.filter_extremes方法代码示例

本文整理汇总了Python中Dictionary.Dictionary.filter_extremes方法的典型用法代码示例。如果您正苦于以下问题:Python Dictionary.filter_extremes方法的具体用法?Python Dictionary.filter_extremes怎么用?Python Dictionary.filter_extremes使用的例子?那么, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在Dictionary.Dictionary的用法示例。


在下文中一共展示了Dictionary.filter_extremes方法的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。

示例1: main

# 需要导入模块: from Dictionary import Dictionary [as 别名]
# 或者: from Dictionary.Dictionary import filter_extremes [as 别名]
def main():
    path = "/path/to/corpus"
    # コーパスの読み込み
    # 前処理
    documents = []
    for filename in os.listdir(path):
        document = open(os.path.join(path, filename)).read().strip()
        document = preprocess(document)
        documents.append(document)

    # 辞書を作成
    # 低頻度すぎるもの, 高頻度すぎる単語は除去
    dictionary = Dictionary(documents)
    dictionary.filter_extremes(no_below=3, no_above=0.6)

    # 辞書の保存
    dictionary.save("id2word.txt")

    # vocabulary の表示
    vocabulary = dictionary.get_vocabulary()
    print vocabulary, "(%d words)" % len(vocabulary)

    # 特徴量(BoWベクトル)への変換
    for document in documents:
        bowvec = dictionary.doc2bow(document)
开发者ID:norikinishida,项目名称:bow-feature-extraction,代码行数:27,代码来源:main.py


注:本文中的Dictionary.Dictionary.filter_extremes方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。