当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark DataFrame withColumnRenamed方法用法及代码示例


PySpark DataFrame 的withColumnRenamed(~) 方法用于替换列标签。如果要替换的列标签不存在,则不会抛出错误。

参数

1.existing | string | optional

现有列的标签。这将被替换。

2. new | string

新的列标签。

返回值

PySpark 数据帧 (pyspark.sql.dataframe.DataFrame)。

例子

考虑以下PySpark DataFrame:

df = spark.createDataFrame([["Alex", 25], ["Bob", 30]], ["name", "age"])
df.show()



+----+---+
|name|age|
+----+---+
|Alex| 25|
| Bob| 30|
+----+---+

替换 PySpark DataFrame 的列标签

要将列标签 age 替换为 AGE

df.withColumnRenamed("age", "AGE").show()



+----+---+
|name|AGE|
+----+---+
|Alex| 25|
| Bob| 30|
+----+---+

请注意,如果要替换的列标签不存在,则不会引发错误:

df.withColumnRenamed("ageeee", "AGE").show()



+----+---+
|name|age|
+----+---+
|Alex| 25|
| Bob| 30|
+----+---+

请注意在这种情况下如何返回原始DataFrame。

替换PySpark DataFrame的多个列标签

要一次替换多个列标签,我们可以像这样链接 withColumnRenamed(-) 方法:

df.withColumnRenamed("age", "AGE").withColumnRenamed("name", "NAME").show()



+----+---+
|NAME|AGE|
+----+---+
|Alex| 25|
| Bob| 30|
+----+---+

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark DataFrame | withColumnRenamed method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。