当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark RDD count方法用法及代码示例


PySpark RDD 的 count(~) 方法以整数形式返回 RDD 中值的数量。

参数

该方法不接受任何参数。

返回值

一个整数 (int)。

例子

考虑以下PySpark RDD:

rdd = sc.parallelize(["A","B","A","B"])
rdd.collect()



['A', 'B', 'A', 'B']

在这里,我们使用 parallelize(~) 方法创建PySpark RDD。

获取 PySpark RDD 中的值数量

要获取 RDD 中的元素数量,请使用 count() 方法:

rdd.count()



4

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark RDD | count method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。