标签:机器学习

各种分类算法的优缺点

qingchuan 机器学习 2,789 次浏览 ,
原文来自: http://bbs.pinggu.org/thread-2604496-1-1.html,这里对部分地方添加了注解以及自己的理解。原文对一些常用的分类算法,如决策树、SVM、朴素贝叶斯、adaboost、KNN等都提到了,总结得比较好,这里增加了一些自己的理解(...

Spark机器学习库指南[Spark 1.3.1版]

qingchuan 机器学习 7,686 次浏览 , , ,
本文内容关键词:Spark官方文档,Spark教程, Spark MLlib教程。 本文翻译自Spark官方文档:Machine Learning Library (MLlib) Guide ,代码示例以Python版为主,部分Python不支持的功能保留原理说明,代码示例略去,另外翻...

常用机器学习算法的点睛之笔

qingchuan 机器学习 1,336 次浏览
AdaBoost: 权值的作用是什么?1)对分错的样本给予更高的权值,给弱分类器的误差加权2)所有弱分类器的投票权重 SVM:  超平面切割空间,支持向量距离最大化,hinge损失函数+L2正则, SGD求解 logistic回归: log(1+exp(-yWTx)),...

Spark机器学习库指南[Spark 1.3.1版]——朴素贝叶斯(Naive Bayes)

qingchuan 机器学习 1,673 次浏览 , ,
下面是章节朴素贝叶斯的正文(其他内容参见全文目录) 朴素贝叶斯是一个简单的多分类算法。之所以称为朴素,是因为该算法假设特征之间相互独立。朴素贝叶斯的训练非常高效:通过一趟遍历训练数据,计算出每个特征对于给定标签的条件...

机器学习资料大汇总[转]

qingchuan 机器学习 1,918 次浏览
本文转自:http://www.52ml.net/star 注:本页面主要针对想快速上手机器学习而又不想深入研究的同学,对于专门的researcher,建议直接啃 PRML,ESL,MLAPP以及你相应方向的书(比如Numerical Optimization,Graphic Model等),另...

揭开机器学习的面纱:SVM 100行代码实现[Python版]

qingchuan 机器学习 2,290 次浏览 , ,
之前对机器学习的理解,仅仅停留在书本上的推导公式,或者对一些开源工具的使用上。高大上的机器学习究竟如何训练、怎样预测的,对我们来说就像是一个黑盒充满神秘。今天,我们就以经典的机器学习算法SVM为例,抛开各种实际处理上的tr...

Python机器学习库 [转]

qingchuan 机器学习 1,859 次浏览
本文转自:http://qxde01.blog.163.com/blog/static/67335744201368101922991/ Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括: 一个强大的N维数组对象Array; ...

机器学习之特征选择常用方法【总结】【原创】

在机器学习中,训练出的模型的好坏,很大程度上取决特征的选择是否恰当。例如SVM模型要取得优秀的分类效果,通常需要配合卡方选择才能实现。这是因为,大量的低质特征有时候会抹杀优质特征的区分度,要么过拟合,要么欠拟合,降低了模...
Go