當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark RDD first方法用法及代碼示例


PySpark RDD 的first(~) 方法返回 RDD 的第一個元素。

參數

該方法不接受任何參數。

返回值

該類型將是 RDD 的第一個元素的類型。

例子

我們使用 parallelize(~) 方法創建一個RDD:

rdd = sc.parallelize([2, 3, 4])
rdd



ParallelCollectionRDD[61] at readRDDFromInputStream at PythonRDD.scala:413

獲取 RDD 的第一個元素

要獲取 RDD 中的第一個元素,請使用 first() 方法:

rdd.first()



2

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark RDD | first method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。