当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark MLUtils.convertMatrixColumnsToML用法及代码示例


本文简要介绍 pyspark.mllib.util.MLUtils.convertMatrixColumnsToML 的用法。

用法:

static convertMatrixColumnsToML(dataset, *cols)

将输入 DataFrame 中的矩阵列从 pyspark.mllib.linalg.Matrix 类型转换为 spark.ml 包下的新 pyspark.ml.linalg.Matrix 类型。

2.0.0 版中的新函数。

参数

datasetDataFrame

输入数据集

*colsstr

要转换的矩阵列。

新的矩阵列将被忽略。如果未指定,则所有旧矩阵列都将转换为嵌套的除外。

返回

DataFrame

将旧矩阵列转换为新矩阵类型的输入数据集

例子

>>> import pyspark
>>> from pyspark.mllib.linalg import Matrices
>>> from pyspark.mllib.util import MLUtils
>>> df = spark.createDataFrame(
...     [(0, Matrices.sparse(2, 2, [0, 2, 3], [0, 1, 1], [2, 3, 4]),
...     Matrices.dense(2, 2, range(4)))], ["id", "x", "y"])
>>> r1 = MLUtils.convertMatrixColumnsToML(df).first()
>>> isinstance(r1.x, pyspark.ml.linalg.SparseMatrix)
True
>>> isinstance(r1.y, pyspark.ml.linalg.DenseMatrix)
True
>>> r2 = MLUtils.convertMatrixColumnsToML(df, "x").first()
>>> isinstance(r2.x, pyspark.ml.linalg.SparseMatrix)
True
>>> isinstance(r2.y, pyspark.mllib.linalg.DenseMatrix)
True

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.mllib.util.MLUtils.convertMatrixColumnsToML。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。