当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark RowMatrix.computePrincipalComponents用法及代码示例


本文简要介绍 pyspark.mllib.linalg.distributed.RowMatrix.computePrincipalComponents 的用法。

用法:

computePrincipalComponents(k)

计算给定行矩阵的 k 个主成分

2.2.0 版中的新函数。

参数

kint

要保留的主成分数。

返回

pyspark.mllib.linalg.DenseMatrix

注意

这不能在超过 65535 列的矩阵上计算。

例子

>>> rows = sc.parallelize([[1, 2, 3], [2, 4, 5], [3, 6, 1]])
>>> rm = RowMatrix(rows)
>>> # Returns the two principal components of rm
>>> pca = rm.computePrincipalComponents(2)
>>> pca
DenseMatrix(3, 2, [-0.349, -0.6981, 0.6252, -0.2796, -0.5592, -0.7805], 0)
>>> # Transform into new dimensions with the greatest variance.
>>> rm.multiply(pca).rows.collect() 
[DenseVector([0.1305, -3.7394]), DenseVector([-0.3642, -6.6983]),         DenseVector([-4.6102, -4.9745])]

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.mllib.linalg.distributed.RowMatrix.computePrincipalComponents。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。