spark - 純淨天空

Spark機器學習庫指南[Spark 1.3.1版]——基礎統計(Basic statistics)

@丹陽 ♢spark, 抽樣, 相關性, 統計, 翻譯

下麵是章節基礎統計的目錄(其他內容參見全文目錄) 匯總統計(Summary statistics) 相關係數(Correlations) 分層抽樣(Stratified sampling) 假設...

@丹陽 ♢spark, 翻譯

下麵是章節數據類型的目錄(其他內容參見全文目錄) 局部向量[Local vector] 標記點[Labeled point] 局部矩陣[Local matrix] 分布式矩陣[Distrib...

@丹陽 ♢L-BFGS, SGD, spark, 優化, 翻譯

下麵是章節優化的目錄(參見全文目錄) 數學描述梯度下降(Gradient descent) 隨機梯度下降 (SGD) 分布式SGD的更新機製有限內存BFGS(Lim...

@丹陽 ♢GBT, RF, spark, 梯度提升樹, 隨機森林

下麵是章節樹的集成的目錄(參見決策樹，其他內容參見全文目錄) 梯度提升樹 vs. 隨機森林隨機森林基礎算法訓練預測使用建...

@丹陽 ♢GINI, spark, 決策樹, 熵

下麵是章節決策樹的目錄(其他內容參見全文目錄) 基礎算法節點不純度和信息增益（Node impurity and information gain）分裂候選集（Split can...

@丹陽 ♢spark, SVM, 分類, 回歸, 線性模型, 翻譯

下麵是章節線性模型的目錄(其他內容參見全文目錄) 數學公式損失函數(Loss functions) 正則化(Regularizers) 優化(Optimization) 分...

@丹陽 ♢hadoop, Linux, Python, spark

Spark作為一種通用且高性能的計算框架，不僅在性能上相對於hadoop mapreduce有了很大的提升；在易用性上也運超hadoop, 不隻提供了map/reduce計算接口，還提供...