當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark MLUtils.saveAsLibSVMFile用法及代碼示例

本文簡要介紹 pyspark.mllib.util.MLUtils.saveAsLibSVMFile 的用法。

用法:

static saveAsLibSVMFile(data, dir)

以 LIBSVM 格式保存標記數據。

1.0.0 版中的新函數。

參數

datapyspark.RDD

要保存的 RDD LabeledPoint

dirstr

保存數據的目錄

例子

>>> from tempfile import NamedTemporaryFile
>>> from fileinput import input
>>> from pyspark.mllib.regression import LabeledPoint
>>> from glob import glob
>>> from pyspark.mllib.util import MLUtils
>>> examples = [LabeledPoint(1.1, Vectors.sparse(3, [(0, 1.23), (2, 4.56)])),
...             LabeledPoint(0.0, Vectors.dense([1.01, 2.02, 3.03]))]
>>> tempFile = NamedTemporaryFile(delete=True)
>>> tempFile.close()
>>> MLUtils.saveAsLibSVMFile(sc.parallelize(examples), tempFile.name)
>>> ''.join(sorted(input(glob(tempFile.name + "/part-0000*"))))
'0.0 1:1.01 2:2.02 3:3.03\n1.1 1:1.23 3:4.56\n'

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.mllib.util.MLUtils.saveAsLibSVMFile。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。