下面是章节分类和回归的目录(其他内容参见全文目录)
MLlib支持多种机器学习方法,这些方法可以用于解决二分类、多分类以及回归分析问题。下表列出了针对每...
下面是章节频繁模式挖掘的内容(其他内容参见全文目录)
频繁项集挖掘是通常是大规模数据分析的第一步,多年以来它都是数据挖掘领域的活跃研究主题。建议用...
下面是章节朴素贝叶斯的正文(其他内容参见全文目录)
朴素贝叶斯是一个简单的多分类算法。之所以称为朴素,是因为该算法假设特征之间相互独立。朴素贝叶斯...
摘要:文章介绍了集成学习的概念和它的发展,它有RF和GBDT两大杀器,它有嫁接法、集成半监督学习的最新进展能够提升学习效果,文章还着重分析了集成学习成功...
Introduction To Machine Learning_review
本文转自:http://www.52ml.net/star
注:本页面主要针对想快速上手机器学习而又不想深入研究的同学,对于专门的researcher,建议直接啃 PRML,ESL,MLAPP...
之前对机器学习的理解,仅仅停留在书本上的推导公式,或者对一些开源工具的使用上。高大上的机器学习究竟如何训练、怎样预测的,对我们来说就像是一个黑盒充...
The Difference Between Distriminative Models And Generative Models
简单来说,判别模型对p(y|x)建模,而生成模型对p(x|y)建模,其中x是特征(features)...
本文转自:http://qxde01.blog.163.com/blog/static/67335744201368101922991/
Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是...
在《机器学习》(Tom.M.Mitchell)这本书中,第四章讲解人工神经网络的时候,给了一个人脸识别的例子,实际是基于人工神经网络反向传播算法来识别灰度图像中的...
在机器学习中,训练出的模型的好坏,很大程度上取决特征的选择是否恰当。例如SVM模型要取得优秀的分类效果,通常需要配合卡方选择才能实现。这是因为,大量的...
一张图弄懂协同过滤:如下面的GIF图所示,已知用户对部分商品的评价(好如不好),通过相似用户的行为可以推测用户对未知项的评价。
上图选自维基百科:ht...
摘要:信息量/熵/信息增益/互信息/交叉熵
本文转自:http://www.cnblogs.com/zhangchaoyang/articles/2655785.html ,对机器学习相关的信息论基本概念做了...
研究数据挖掘和机器学习有一段时间了,对数据挖掘来说,商用软件有SAS、 Clementine、Oracle数据挖掘组件等等;由于个人学习和版权、算法定制等问题,开源的...
摘要:朴素贝叶斯分类/文本分类
本文转自:http://www.cnblogs.com/zhangchaoyang/articles/2586402.html ,有例子+简单公式推导,介绍朴素贝叶斯的好文章...