本文是Spark2.1官方文檔的翻譯:Extracting, transforming and selecting features => Spark特征抽取、特征轉換、特征選擇,全文目錄如下:
Feature ...
使用機器學習方法解決實際問題時,我們通常要用L1或L2範數做正則化(regularization),從而限製權值大小,減少過擬合風險。特別是在使用梯度下降來做目標函...
下麵是章節協同過濾的目錄(其他內容參見全文目錄)
協同過濾
顯示反饋VS隱士反饋
正則化參數的擴展
示例
教程
協同過濾
協同過...
原文來自: http://bbs.pinggu.org/thread-2604496-1-1.html,這裏對部分地方添加了注解以及自己的理解。原文對一些常用的分類算法,如決策樹、SVM、樸素貝葉...
本文內容關鍵詞:Spark官方文檔,Spark教程, Spark MLlib教程。
本文翻譯自Spark官方文檔:Machine Learning Library (MLlib) Guide ,代碼示例以P...
AdaBoost: 權值的作用是什麽?1)對分錯的樣本給予更高的權值,給弱分類器的誤差加權2)所有弱分類器的投票權重
SVM: 超平麵切割空間,支持向量距離最...
理論說明部分見上一篇:
最大熵模型簡介[例子+推導+GIS求解]
為了是代碼簡短,方便閱讀,去掉了很多健壯性檢測的代碼以及特殊處理。下麵的代碼實現的...
這篇文章是參考:https://github.com/ceys/jdml/wiki/ALS 改寫的,由於原文Latex公式沒有正常展現+少量筆誤,妨礙閱讀,所以這裏重新整理了一下。
ALS是al...
這篇文章是結合論文http://www.cqvip.com/Main/Detail.aspx?id=7707219對博文:http://www.cnblogs.com/hexinuaa/p/3353479.html加入自己的理解做了簡化重...
在傳統基於內容的推薦係統中,根據商品特性的相似性來做推薦,例如:如果你購買了Machine Learning, Tom M.Mitchell這本書,係統會給你推薦The Elements of S...
下麵是章節降維的內容(其他內容參見全文目錄)
奇異值分解 (SVD)
性能
SVD示例
主成分分析 (PCA)
降維 是減少變量數量的過程。它可以用來...
下麵是章節基礎統計的目錄(其他內容參見全文目錄)
匯總統計(Summary statistics)
相關係數(Correlations)
分層抽樣(Stratified sampling)
假設檢驗...
下麵是章節數據類型的目錄(其他內容參見全文目錄)
局部向量[Local vector]
標記點[Labeled point]
局部矩陣[Local matrix]
分布式矩陣[Distributed...
下麵是章節特征提取和轉換的內容(其他內容參見全文目錄)
TF-IDF
Word2Vec
模型
示例
標準化(StandardScaler)
模型擬合
...