當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark RandomRDDs.uniformRDD用法及代碼示例


本文簡要介紹 pyspark.mllib.random.RandomRDDs.uniformRDD 的用法。

用法:

static uniformRDD(sc, size, numPartitions=None, seed=None)

生成一個由 i.i.d 組成的 RDD。來自均勻分布 U(0.0, 1.0) 的樣本。

要將生成的 RDD 中的分布從 U(0.0, 1.0) 轉換為 U(a, b),請使用RandomRDDs.uniformRDD(sc, n, p, seed).map(lambda v: a + (b - a) * v)

1.1.0 版中的新函數。

參數

scSparkContext

用於創建 RDD。

sizeint

RDD 的大小。

numPartitions整數,可選

RDD 中的分區數(默認值:sc.defaultParallelism)。

seed整數,可選

隨機種子(默認值:隨機長整數)。

返回

pyspark.RDD

由 i.i.d. 組成的浮點數 RDD樣本 ~ U(0.0, 1.0)

例子

>>> x = RandomRDDs.uniformRDD(sc, 100).collect()
>>> len(x)
100
>>> max(x) <= 1.0 and min(x) >= 0.0
True
>>> RandomRDDs.uniformRDD(sc, 100, 4).getNumPartitions()
4
>>> parts = RandomRDDs.uniformRDD(sc, 100, seed=4).getNumPartitions()
>>> parts == sc.defaultParallelism
True

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.mllib.random.RandomRDDs.uniformRDD。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。