作者:丹阳

Spark中ml和mllib的区别

Spark中ml和mllib的主要区别和联系如下: ml和mllib都是Spark中的机器学习库,目前常用的机器学习功能2个库都能满足需求。 spark官方推荐使用ml, ...

pyspark LDA模型示例

潜在的Dirichlet分配(LDA),是专为文本文档设计的主题模型。 术语说明: “word”=“term”:词汇表的元素。 “token”:出现在文档中的term的实例。 ...

XGBoost调参注意事项

机器学习中参数调整是门艺术,模型的最佳参数可能取决于许多场景,所以很难为此做一个全面的指导。本文尝试为xgboost中的参数调整提供一些说明。 了解偏...

Mysql支持JSON类型

Mysql从5.7.8版本之后,就开始原生支持JSON(JavaScript Object Notation)类型了。这跟以往直接把JSON字符串存到Mysql的文本类型不一样,因为使用MySQL原生的J...