当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DCT用法及代码示例


本文简要介绍 pyspark.ml.feature.DCT 的用法。

用法:

class pyspark.ml.feature.DCT(*, inverse=False, inputCol=None, outputCol=None)

一个特征变换器,它对一个实向量进行一维离散余弦变换。不对输入向量执行零填充。它返回一个表示 DCT 的相同长度的实向量。返回向量被缩放,使得变换矩阵是单一的(又名缩放的DCT-II)。

版本 1.6.0 中的新函数。

注意

More information on Wikipedia

例子

>>> from pyspark.ml.linalg import Vectors
>>> df1 = spark.createDataFrame([(Vectors.dense([5.0, 8.0, 6.0]),)], ["vec"])
>>> dct = DCT( )
>>> dct.setInverse(False)
DCT...
>>> dct.setInputCol("vec")
DCT...
>>> dct.setOutputCol("resultVec")
DCT...
>>> df2 = dct.transform(df1)
>>> df2.head().resultVec
DenseVector([10.969..., -0.707..., -2.041...])
>>> df3 = DCT(inverse=True, inputCol="resultVec", outputCol="origVec").transform(df2)
>>> df3.head().origVec
DenseVector([5.0, 8.0, 6.0])
>>> dctPath = temp_path + "/dct"
>>> dct.save(dctPath)
>>> loadedDtc = DCT.load(dctPath)
>>> loadedDtc.transform(df1).take(1) == dct.transform(df1).take(1)
True
>>> loadedDtc.getInverse()
False

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.ml.feature.DCT。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。