當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark DataFrame toPandas方法用法及代碼示例


PySpark DataFrame 的 toPandas(~) 方法將 PySpark DataFrame 轉換為 Pandas DataFrame。

警告

請注意以下事項:

  • 所有來自工作節點的數據都會傳輸到Driver,因此請確保您的Driver有足夠的內存。

  • 驅動程序必須安裝 Pandas 庫。

參數

該方法不接受任何參數。

返回值

Pandas DataFrame 。

例子

考慮以下 DataFrame :

df = spark.createDataFrame([["Alex", 20], ["Bob", 24], ["Cathy", 22]], ["name", "age"])
df.show()



+-----+---+
| name|age|
+-----+---+
| Alex| 20|
|  Bob| 24|
|Cathy| 22|
+-----+---+

將 PySpark DataFrame 轉換為 Pandas DataFrame

將此 PySpark DataFrame 轉換為 Pandas DataFrame:

df.toPandas()



   name   age
0  Alex   20
1  Bob    24
2  Cathy  22

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark DataFrame | toPandas method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。