当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark MLUtils.convertMatrixColumnsFromML用法及代码示例


本文简要介绍 pyspark.mllib.util.MLUtils.convertMatrixColumnsFromML 的用法。

用法:

static convertMatrixColumnsFromML(dataset, *cols)

将输入 DataFrame 中的矩阵列从 spark.ml 包下的新 pyspark.ml.linalg.Matrix 类型转换为 pyspark.mllib.linalg.Matrix 类型。

2.0.0 版中的新函数。

参数

datasetDataFrame

输入数据集

*colsstr

要转换的矩阵列。

旧的矩阵列将被忽略。如果未指定,所有新的矩阵列都将被转换,嵌套列除外。

返回

DataFrame

具有转换为旧矩阵类型的新矩阵列的输入数据集

例子

>>> import pyspark
>>> from pyspark.ml.linalg import Matrices
>>> from pyspark.mllib.util import MLUtils
>>> df = spark.createDataFrame(
...     [(0, Matrices.sparse(2, 2, [0, 2, 3], [0, 1, 1], [2, 3, 4]),
...     Matrices.dense(2, 2, range(4)))], ["id", "x", "y"])
>>> r1 = MLUtils.convertMatrixColumnsFromML(df).first()
>>> isinstance(r1.x, pyspark.mllib.linalg.SparseMatrix)
True
>>> isinstance(r1.y, pyspark.mllib.linalg.DenseMatrix)
True
>>> r2 = MLUtils.convertMatrixColumnsFromML(df, "x").first()
>>> isinstance(r2.x, pyspark.mllib.linalg.SparseMatrix)
True
>>> isinstance(r2.y, pyspark.ml.linalg.DenseMatrix)
True

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.mllib.util.MLUtils.convertMatrixColumnsFromML。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。