當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark DataFrame rdd屬性用法及代碼示例


PySpark DataFrame 的 rdd 屬性返回 DataFrame 的 RDD 表示形式。請記住,PySpark DataFrame 在內部表示為 RDD。

返回值

RDD 包含 Row 對象。

例子

考慮以下PySpark DataFrame:

df = spark.createDataFrame([["Alex", 25], ["Bob", 30]], ["name", "age"])
df.show()



+----+---+
|name|age|
+----+---+
|Alex| 25|
| Bob| 30|
+----+---+

將 PySpark DataFrame 轉換為 RDD

要將 PySpark DataFrame 轉換為 RDD,請使用 rdd 屬性:

rdd = df.rdd
rdd.collect()



[Row(name='Alex', age=25), Row(name='Bob', age=30)]

在這裏,我們使用 collect() 方法來查看RDD的內容,它是Row對象的列表。

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark DataFrame | rdd property。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。