下麵是章節分類和回歸的目錄(其他內容參見全文目錄)
MLlib支持多種機器學習方法,這些方法可以用於解決二分類、多分類以及回歸分析問題。下表列出了針對每...
下麵是章節頻繁模式挖掘的內容(其他內容參見全文目錄)
頻繁項集挖掘是通常是大規模數據分析的第一步,多年以來它都是數據挖掘領域的活躍研究主題。建議用...
下麵是章節樸素貝葉斯的正文(其他內容參見全文目錄)
樸素貝葉斯是一個簡單的多分類算法。之所以稱為樸素,是因為該算法假設特征之間相互獨立。樸素貝葉斯...
摘要:文章介紹了集成學習的概念和它的發展,它有RF和GBDT兩大殺器,它有嫁接法、集成半監督學習的最新進展能夠提升學習效果,文章還著重分析了集成學習成功...
Introduction To Machine Learning_review
本文轉自:http://www.52ml.net/star
注:本頁麵主要針對想快速上手機器學習而又不想深入研究的同學,對於專門的researcher,建議直接啃 PRML,ESL,MLAPP...
之前對機器學習的理解,僅僅停留在書本上的推導公式,或者對一些開源工具的使用上。高大上的機器學習究竟如何訓練、怎樣預測的,對我們來說就像是一個黑盒充...
The Difference Between Distriminative Models And Generative Models
簡單來說,判別模型對p(y|x)建模,而生成模型對p(x|y)建模,其中x是特征(features)...
本文轉自:http://qxde01.blog.163.com/blog/static/67335744201368101922991/
Python在科學計算領域,有兩個重要的擴展模塊:Numpy和Scipy。其中Numpy是...
在《機器學習》(Tom.M.Mitchell)這本書中,第四章講解人工神經網絡的時候,給了一個人臉識別的例子,實際是基於人工神經網絡反向傳播算法來識別灰度圖像中的...
在機器學習中,訓練出的模型的好壞,很大程度上取決特征的選擇是否恰當。例如SVM模型要取得優秀的分類效果,通常需要配合卡方選擇才能實現。這是因為,大量的...
一張圖弄懂協同過濾:如下麵的GIF圖所示,已知用戶對部分商品的評價(好如不好),通過相似用戶的行為可以推測用戶對未知項的評價。
上圖選自維基百科:ht...
摘要:信息量/熵/信息增益/互信息/交叉熵
本文轉自:http://www.cnblogs.com/zhangchaoyang/articles/2655785.html ,對機器學習相關的信息論基本概念做了...
研究數據挖掘和機器學習有一段時間了,對數據挖掘來說,商用軟件有SAS、 Clementine、Oracle數據挖掘組件等等;由於個人學習和版權、算法定製等問題,開源的...
摘要:樸素貝葉斯分類/文本分類
本文轉自:http://www.cnblogs.com/zhangchaoyang/articles/2586402.html ,有例子+簡單公式推導,介紹樸素貝葉斯的好文章...