當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark DataFrame withColumnRenamed方法用法及代碼示例


PySpark DataFrame 的withColumnRenamed(~) 方法用於替換列標簽。如果要替換的列標簽不存在,則不會拋出錯誤。

參數

1.existing | string | optional

現有列的標簽。這將被替換。

2. new | string

新的列標簽。

返回值

PySpark 數據幀 (pyspark.sql.dataframe.DataFrame)。

例子

考慮以下PySpark DataFrame:

df = spark.createDataFrame([["Alex", 25], ["Bob", 30]], ["name", "age"])
df.show()



+----+---+
|name|age|
+----+---+
|Alex| 25|
| Bob| 30|
+----+---+

替換 PySpark DataFrame 的列標簽

要將列標簽 age 替換為 AGE

df.withColumnRenamed("age", "AGE").show()



+----+---+
|name|AGE|
+----+---+
|Alex| 25|
| Bob| 30|
+----+---+

請注意,如果要替換的列標簽不存在,則不會引發錯誤:

df.withColumnRenamed("ageeee", "AGE").show()



+----+---+
|name|age|
+----+---+
|Alex| 25|
| Bob| 30|
+----+---+

請注意在這種情況下如何返回原始DataFrame。

替換PySpark DataFrame的多個列標簽

要一次替換多個列標簽,我們可以像這樣鏈接 withColumnRenamed(-) 方法:

df.withColumnRenamed("age", "AGE").withColumnRenamed("name", "NAME").show()



+----+---+
|NAME|AGE|
+----+---+
|Alex| 25|
| Bob| 30|
+----+---+

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark DataFrame | withColumnRenamed method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。