标签:pyspark

pyspark LDA模型示例

潜在的Dirichlet分配(LDA),是专为文本文档设计的主题模型。 术语说明: “word”=“term”:词汇表的元素。 “token”:出现在文档中的term的实例。 ...