當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark RowMatrix.computePrincipalComponents用法及代碼示例


本文簡要介紹 pyspark.mllib.linalg.distributed.RowMatrix.computePrincipalComponents 的用法。

用法:

computePrincipalComponents(k)

計算給定行矩陣的 k 個主成分

2.2.0 版中的新函數。

參數

kint

要保留的主成分數。

返回

pyspark.mllib.linalg.DenseMatrix

注意

這不能在超過 65535 列的矩陣上計算。

例子

>>> rows = sc.parallelize([[1, 2, 3], [2, 4, 5], [3, 6, 1]])
>>> rm = RowMatrix(rows)
>>> # Returns the two principal components of rm
>>> pca = rm.computePrincipalComponents(2)
>>> pca
DenseMatrix(3, 2, [-0.349, -0.6981, 0.6252, -0.2796, -0.5592, -0.7805], 0)
>>> # Transform into new dimensions with the greatest variance.
>>> rm.multiply(pca).rows.collect() 
[DenseVector([0.1305, -3.7394]), DenseVector([-0.3642, -6.6983]),         DenseVector([-4.6102, -4.9745])]

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.mllib.linalg.distributed.RowMatrix.computePrincipalComponents。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。