當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark RandomRDDs.gammaRDD用法及代碼示例


本文簡要介紹 pyspark.mllib.random.RandomRDDs.gammaRDD 的用法。

用法:

static gammaRDD(sc, shape, scale, size, numPartitions=None, seed=None)

生成一個由 i.i.d 組成的 RDD。來自具有輸入形狀和比例的 Gamma 分布的樣本。

版本 1.3.0 中的新函數。

參數

scSparkContext

SparkContext 用於創建 RDD。

shape浮點數

Gamma 分布的形狀 (> 0) 參數

scale浮點數

Gamma 分布的比例 (> 0) 參數

sizeint

RDD 的大小。

numPartitions整數,可選

RDD 中的分區數(默認值:sc.defaultParallelism)。

seed整數,可選

隨機種子(默認值:隨機長整數)。

返回

pyspark.RDD

由 i.i.d. 組成的浮點數 RDD樣本〜伽瑪(形狀,比例)。

例子

>>> from math import sqrt
>>> shape = 1.0
>>> scale = 2.0
>>> expMean = shape * scale
>>> expStd = sqrt(shape * scale * scale)
>>> x = RandomRDDs.gammaRDD(sc, shape, scale, 1000, seed=2)
>>> stats = x.stats()
>>> stats.count()
1000
>>> abs(stats.mean() - expMean) < 0.5
True
>>> abs(stats.stdev() - expStd) < 0.5
True

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.mllib.random.RandomRDDs.gammaRDD。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。