當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark RDD count方法用法及代碼示例


PySpark RDD 的 count(~) 方法以整數形式返回 RDD 中值的數量。

參數

該方法不接受任何參數。

返回值

一個整數 (int)。

例子

考慮以下PySpark RDD:

rdd = sc.parallelize(["A","B","A","B"])
rdd.collect()



['A', 'B', 'A', 'B']

在這裏,我們使用 parallelize(~) 方法創建PySpark RDD。

獲取 PySpark RDD 中的值數量

要獲取 RDD 中的元素數量,請使用 count() 方法:

rdd.count()



4

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark RDD | count method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。