本文簡要介紹
pyspark.sql.DataFrame.withColumn
的用法。用法:
DataFrame.withColumn(colName, col)
通過添加列或替換具有相同名稱的現有列來返回新的
DataFrame
。列表達式必須是對此
DataFrame
的表達式;嘗試從其他DataFrame
添加列將引發錯誤。版本 1.3.0 中的新函數。
注意:
此方法在內部引入了投影。因此,多次調用它,例如,通過循環以添加多個列可能會生成可能導致性能問題甚至
StackOverflowException
的大計劃。為避免這種情況,請同時對多列使用select()
。例子:
>>> df.withColumn('age2', df.age + 2).collect() [Row(age=2, name='Alice', age2=4), Row(age=5, name='Bob', age2=7)]
相關用法
- Python pyspark DataFrame.withColumnRenamed用法及代碼示例
- Python pyspark DataFrame.withWatermark用法及代碼示例
- Python pyspark DataFrame.where用法及代碼示例
- Python pyspark DataFrame.writeTo用法及代碼示例
- Python pyspark DataFrame.to_latex用法及代碼示例
- Python pyspark DataFrame.align用法及代碼示例
- Python pyspark DataFrame.plot.bar用法及代碼示例
- Python pyspark DataFrame.to_delta用法及代碼示例
- Python pyspark DataFrame.quantile用法及代碼示例
- Python pyspark DataFrame.cumsum用法及代碼示例
- Python pyspark DataFrame.iloc用法及代碼示例
- Python pyspark DataFrame.dropDuplicates用法及代碼示例
- Python pyspark DataFrame.printSchema用法及代碼示例
- Python pyspark DataFrame.to_table用法及代碼示例
- Python pyspark DataFrame.rmod用法及代碼示例
- Python pyspark DataFrame.div用法及代碼示例
- Python pyspark DataFrame.drop_duplicates用法及代碼示例
- Python pyspark DataFrame.to_pandas用法及代碼示例
- Python pyspark DataFrame.sum用法及代碼示例
- Python pyspark DataFrame.transform用法及代碼示例
- Python pyspark DataFrame.get用法及代碼示例
- Python pyspark DataFrame.rsub用法及代碼示例
- Python pyspark DataFrame.pandas_on_spark.apply_batch用法及代碼示例
- Python pyspark DataFrame.groupBy用法及代碼示例
- Python pyspark DataFrame.head用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.DataFrame.withColumn。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。