本文内容关键词:Spark官方文档,Spark教程, Spark MLlib教程。
本文翻译自Spark官方文档:Machine Learning Library (MLlib) Guide ,代码示例以Python版...
				 
		
         
		        		
                	
							
				
						
                	
	本文翻译自Spark官方文档:Spark Programming Guide, (spark 1.3.0)去掉了其中Scala/Java的内容,只保留了Python及公共部分。 
	关键词:spar...
				 
		
         
		        		
                	
							
				
						
                	下面是章节基础统计的目录(其他内容参见全文目录)
 	汇总统计(Summary statistics)
 	相关系数(Correlations)
 	分层抽样(Stratified sampling)
 	假设...
				 
		
         
		        		
                	
							
				
						
                	下面是章节数据类型的目录(其他内容参见全文目录)
 	局部向量[Local vector]
 	标记点[Labeled point]
 	局部矩阵[Local matrix]
 	分布式矩阵[Distrib...
				 
		
         
		        		
                	
							
				
						
                	下面是章节优化的目录(参见全文目录)
 	数学描述
 	梯度下降(Gradient descent)
 	随机梯度下降 (SGD)
 	分布式SGD的更新机制
 	有限内存BFGS(Lim...
				 
		
         
		        		
                	
							
				
						
                	下面是章节线性模型的目录(其他内容参见全文目录)
 	数学公式
 	损失函数(Loss functions)
 	正则化(Regularizers)
 	优化(Optimization)
 	分...
				 
		
         
		        		
                	
							
				
						
                	下面是章节朴素贝叶斯的正文(其他内容参见全文目录)
朴素贝叶斯是一个简单的多分类算法。之所以称为朴素,是因为该算法假设特征之间相互独立。朴素贝叶斯...