当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark RDD first方法用法及代码示例


PySpark RDD 的first(~) 方法返回 RDD 的第一个元素。

参数

该方法不接受任何参数。

返回值

该类型将是 RDD 的第一个元素的类型。

例子

我们使用 parallelize(~) 方法创建一个RDD:

rdd = sc.parallelize([2, 3, 4])
rdd



ParallelCollectionRDD[61] at readRDDFromInputStream at PythonRDD.scala:413

获取 RDD 的第一个元素

要获取 RDD 中的第一个元素,请使用 first() 方法:

rdd.first()



2

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark RDD | first method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。