當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark RandomRDDs.logNormalVectorRDD用法及代碼示例


本文簡要介紹 pyspark.mllib.random.RandomRDDs.logNormalVectorRDD 的用法。

用法:

static logNormalVectorRDD(sc, mean, std, numRows, numCols, numPartitions=None, seed=None)

生成由包含 i.i.d 的向量組成的 RDD。從對數正態分布中抽取的樣本。

版本 1.3.0 中的新函數。

參數

scSparkContext

SparkContext 用於創建 RDD。

mean浮點數

對數正態分布的平均值

std浮點數

對數正態分布的標準差

numRowsint

RDD 中的向量數。

numColsint

每個向量中的元素數。

numPartitions整數,可選

RDD 中的分區數(默認值:sc.defaultParallelism)。

seed整數,可選

隨機種子(默認值:隨機長整數)。

返回

pyspark.RDD

帶有包含 i.i.d 的向量的向量的 RDD。樣本~記錄N(mean, std)

例子

>>> import numpy as np
>>> from math import sqrt, exp
>>> mean = 0.0
>>> std = 1.0
>>> expMean = exp(mean + 0.5 * std * std)
>>> expStd = sqrt((exp(std * std) - 1.0) * exp(2.0 * mean + std * std))
>>> m = RandomRDDs.logNormalVectorRDD(sc, mean, std, 100, 100, seed=1).collect()
>>> mat = np.matrix(m)
>>> mat.shape
(100, 100)
>>> abs(mat.mean() - expMean) < 0.1
True
>>> abs(mat.std() - expStd) < 0.1
True

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.mllib.random.RandomRDDs.logNormalVectorRDD。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。