当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark MLUtils.convertVectorColumnsFromML用法及代码示例


本文简要介绍 pyspark.mllib.util.MLUtils.convertVectorColumnsFromML 的用法。

用法:

static convertVectorColumnsFromML(dataset, *cols)

将输入 DataFrame 中的向量列从 spark.ml 包下的新 pyspark.ml.linalg.Vector 类型转换为 pyspark.mllib.linalg.Vector 类型。

2.0.0 版中的新函数。

参数

datasetDataFrame

输入数据集

*colsstr

要转换的向量列。

旧的向量列将被忽略。如果未指定,所有新的向量列都将被转换,嵌套的除外。

返回

DataFrame

将新向量列转换为旧向量类型的输入数据集

例子

>>> import pyspark
>>> from pyspark.ml.linalg import Vectors
>>> from pyspark.mllib.util import MLUtils
>>> df = spark.createDataFrame(
...     [(0, Vectors.sparse(2, [1], [1.0]), Vectors.dense(2.0, 3.0))],
...     ["id", "x", "y"])
>>> r1 = MLUtils.convertVectorColumnsFromML(df).first()
>>> isinstance(r1.x, pyspark.mllib.linalg.SparseVector)
True
>>> isinstance(r1.y, pyspark.mllib.linalg.DenseVector)
True
>>> r2 = MLUtils.convertVectorColumnsFromML(df, "x").first()
>>> isinstance(r2.x, pyspark.mllib.linalg.SparseVector)
True
>>> isinstance(r2.y, pyspark.ml.linalg.DenseVector)
True

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.mllib.util.MLUtils.convertVectorColumnsFromML。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。