当前位置: 首页>>代码示例>>Python>>正文


Python Vocabulary.save方法代码示例

本文整理汇总了Python中vocabulary.Vocabulary.save方法的典型用法代码示例。如果您正苦于以下问题:Python Vocabulary.save方法的具体用法?Python Vocabulary.save怎么用?Python Vocabulary.save使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在vocabulary.Vocabulary的用法示例。


在下文中一共展示了Vocabulary.save方法的2个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。

示例1: collect_files

# 需要导入模块: from vocabulary import Vocabulary [as 别名]
# 或者: from vocabulary.Vocabulary import save [as 别名]
        print >> sys.stderr, '%s [stop word file] [output name] ' \
                             '[doc file] ...' % sys.argv[0]
        sys.exit(1)

    file_list = []
    for _dir in sys.argv[3:]:
        collect_files(file_list, _dir)

    stop_word = Vocabulary()
    stop_word.load(sys.argv[1])
    vocab = Vocabulary()
    articles = []

    for filename in file_list:
        article = stem_file(filename, vocab, stop_word)
        articles.append(article)
    # random.shuffle(articles)

    vocab.sort()
    vocab.save(sys.argv[2] + '-vocab')

    fp = open(sys.argv[2] + '-train', 'w')
    for article in articles:
        sb = ''
        for word in article:
            sb += '%d ' % vocab.get_id_from_token(word)
        sb = sb.rstrip()
        fp.write(sb)
        fp.write('\n')
    fp.close()
开发者ID:zhangyafeikimi,项目名称:ml-pack,代码行数:32,代码来源:gen_yahoo.py

示例2: len

# 需要导入模块: from vocabulary import Vocabulary [as 别名]
# 或者: from vocabulary.Vocabulary import save [as 别名]
                    count = word_count.get(stemmed_word, 0) + 1
                    word_count[stemmed_word] = count
    infile.close()
    return word_count

if __name__ == '__main__':
    if len(sys.argv) <= 2:
        print >>sys.stderr, '%s [stop word file] [doc file] ...' % sys.argv[0]
        sys.exit(1)

    stop_word = Vocabulary()
    stop_word.load(sys.argv[1])
    vocab = Vocabulary()
    word_count_list = []

    for filename in sys.argv[2:]:
        word_count = stem_file(filename, vocab, stop_word)
        word_count_list.append(word_count)
    vocab.sort()
    vocab.save('train.vocab')

    fp = open('train', 'w')
    for word_count in word_count_list:
        for word in word_count.keys():
            id = vocab.get_id_from_token(word)
            count = word_count[word]
            fp.write('%d:%d ' % (id, count))
        fp.write('\n')
    fp.close()

开发者ID:kurff,项目名称:ml-lda,代码行数:31,代码来源:lda_doc_proc.py


注:本文中的vocabulary.Vocabulary.save方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。