標簽:pyspark

pyspark LDA模型示例

潛在的Dirichlet分配(LDA),是專為文本文檔設計的主題模型。 術語說明: “word”=“term”:詞匯表的元素。 “token”:出現在文檔中的term的實例。 ...