當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark MLUtils.convertVectorColumnsFromML用法及代碼示例

本文簡要介紹 pyspark.mllib.util.MLUtils.convertVectorColumnsFromML 的用法。

用法:

static convertVectorColumnsFromML(dataset, *cols)

將輸入 DataFrame 中的向量列從 spark.ml 包下的新 pyspark.ml.linalg.Vector 類型轉換為 pyspark.mllib.linalg.Vector 類型。

2.0.0 版中的新函數。

參數

datasetDataFrame

輸入數據集

*colsstr

要轉換的向量列。

舊的向量列將被忽略。如果未指定,所有新的向量列都將被轉換,嵌套的除外。

返回

DataFrame

將新向量列轉換為舊向量類型的輸入數據集

例子

>>> import pyspark
>>> from pyspark.ml.linalg import Vectors
>>> from pyspark.mllib.util import MLUtils
>>> df = spark.createDataFrame(
...     [(0, Vectors.sparse(2, [1], [1.0]), Vectors.dense(2.0, 3.0))],
...     ["id", "x", "y"])
>>> r1 = MLUtils.convertVectorColumnsFromML(df).first()
>>> isinstance(r1.x, pyspark.mllib.linalg.SparseVector)
True
>>> isinstance(r1.y, pyspark.mllib.linalg.DenseVector)
True
>>> r2 = MLUtils.convertVectorColumnsFromML(df, "x").first()
>>> isinstance(r2.x, pyspark.mllib.linalg.SparseVector)
True
>>> isinstance(r2.y, pyspark.ml.linalg.DenseVector)
True

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.mllib.util.MLUtils.convertVectorColumnsFromML。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。