PyTorch是一个python包,提供两类高级功能:
具有强大的GPU加速度的张量计算(类似numpy)
基于tape-based的自动微分(autodiff)系统的深度神经网络
您...
Keras简介
Keras是一个高级神经网络API,用Python编写,能够运行在TensorFlow或者Theano之上。它的开发重点是实现快速实验。从想法到结果延迟很小,是做好...
类ChiSqSelector声明
class pyspark.mllib.feature.ChiSqSelector(numTopFeatures=50, selectorType='numTopFeatures', percentile=0.1, fpr=0.05)
类ChiS...
Spark中ml和mllib的主要区别和联系如下:
ml和mllib都是Spark中的机器学习库,目前常用的机器学习功能2个库都能满足需求。
spark官方推荐使用ml, 因...
潜在的Dirichlet分配(LDA),是专为文本文档设计的主题模型。
术语说明:
“word”=“term”:词汇表的元素。
“token”:出现在文档中的term的实例。
“topic”...
GBDT分类
pyspark使用类GradientBoostedTrees的trainClassifier函数进行GBDT分类模型训练:
trainClassifier(data, categoricalFeaturesInfo, loss='logLos...
机器学习中参数调整是门艺术,模型的最佳参数可能取决于许多场景,所以很难为此做一个全面的指导。本文尝试为xgboost中的参数调整提供一些说明。
了解偏...
pyspark中的RandomForest,也就是随机森林,既可以训练分类模型,也可以训练回归模型,下面分别介绍。
RandomForest分类
使用RondomForest建立分类模型...
类用法简介
class pyspark.mllib.classification.LogisticRegressionModel(weights, intercept, numFeatures, numClasses)
LogisticRegressionModel: 使用...
本文由Tracholar授权发布,未经允许,请勿转载。
在组内做过一次因子机的技术分享,这里将内容以及自己的思考记录如下。
综述
什么是因...
本文是Spark2.1官方文档的翻译:Extracting, transforming and selecting features => Spark特征抽取、特征转换、特征选择,全文目录如下:
Feature ...
SDCC2015-机器学习在美团用户画像中的应用-V2 下载
部分内容预览:
1)特征工程:
2)模型:
使用机器学习方法解决实际问题时,我们通常要用L1或L2范数做正则化(regularization),从而限制权值大小,减少过拟合风险。特别是在使用梯度下降来做目标函...
下面是章节协同过滤的目录(其他内容参见全文目录)
协同过滤
显示反馈VS隐士反馈
正则化参数的扩展
示例
教程
协同过滤
协同过...
原文来自: http://bbs.pinggu.org/thread-2604496-1-1.html,这里对部分地方添加了注解以及自己的理解。原文对一些常用的分类算法,如决策树、SVM、朴素贝叶...