當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark RandomRDDs.uniformVectorRDD用法及代碼示例


本文簡要介紹 pyspark.mllib.random.RandomRDDs.uniformVectorRDD 的用法。

用法:

static uniformVectorRDD(sc, numRows, numCols, numPartitions=None, seed=None)

生成由包含 i.i.d 的向量組成的 RDD。從均勻分布 U(0.0, 1.0) 中抽取的樣本。

1.1.0 版中的新函數。

參數

scSparkContext

SparkContext 用於創建 RDD。

numRowsint

RDD 中的向量數。

numColsint

每個向量中的元素數。

numPartitions整數,可選

RDD 中的分區數。

seed整數,可選

為每個分區中的生成器生成種子的 RNG 的種子。

返回

pyspark.RDD

向量的 RDD,向量包含 i.i.d 樣本 ~ U(0.0, 1.0)

例子

>>> import numpy as np
>>> mat = np.matrix(RandomRDDs.uniformVectorRDD(sc, 10, 10).collect())
>>> mat.shape
(10, 10)
>>> mat.max() <= 1.0 and mat.min() >= 0.0
True
>>> RandomRDDs.uniformVectorRDD(sc, 10, 10, 4).getNumPartitions()
4

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.mllib.random.RandomRDDs.uniformVectorRDD。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。