本文简要介绍
pyspark.sql.DataFrame.withColumn
的用法。用法:
DataFrame.withColumn(colName, col)
通过添加列或替换具有相同名称的现有列来返回新的
DataFrame
。列表达式必须是对此
DataFrame
的表达式;尝试从其他DataFrame
添加列将引发错误。版本 1.3.0 中的新函数。
注意:
此方法在内部引入了投影。因此,多次调用它,例如,通过循环以添加多个列可能会生成可能导致性能问题甚至
StackOverflowException
的大计划。为避免这种情况,请同时对多列使用select()
。例子:
>>> df.withColumn('age2', df.age + 2).collect() [Row(age=2, name='Alice', age2=4), Row(age=5, name='Bob', age2=7)]
相关用法
- Python pyspark DataFrame.withColumnRenamed用法及代码示例
- Python pyspark DataFrame.withWatermark用法及代码示例
- Python pyspark DataFrame.where用法及代码示例
- Python pyspark DataFrame.writeTo用法及代码示例
- Python pyspark DataFrame.to_latex用法及代码示例
- Python pyspark DataFrame.align用法及代码示例
- Python pyspark DataFrame.plot.bar用法及代码示例
- Python pyspark DataFrame.to_delta用法及代码示例
- Python pyspark DataFrame.quantile用法及代码示例
- Python pyspark DataFrame.cumsum用法及代码示例
- Python pyspark DataFrame.iloc用法及代码示例
- Python pyspark DataFrame.dropDuplicates用法及代码示例
- Python pyspark DataFrame.printSchema用法及代码示例
- Python pyspark DataFrame.to_table用法及代码示例
- Python pyspark DataFrame.rmod用法及代码示例
- Python pyspark DataFrame.div用法及代码示例
- Python pyspark DataFrame.drop_duplicates用法及代码示例
- Python pyspark DataFrame.to_pandas用法及代码示例
- Python pyspark DataFrame.sum用法及代码示例
- Python pyspark DataFrame.transform用法及代码示例
- Python pyspark DataFrame.get用法及代码示例
- Python pyspark DataFrame.rsub用法及代码示例
- Python pyspark DataFrame.pandas_on_spark.apply_batch用法及代码示例
- Python pyspark DataFrame.groupBy用法及代码示例
- Python pyspark DataFrame.head用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrame.withColumn。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。