当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark Column otherwise方法用法及代码示例


PySpark 列的otherwise(~) 方法在 when(~) 方法之后使用,以实现if-else 逻辑。单击此处查看有关 when(~) 方法的文档。

参数

1.value

如果不满足 when(~) 设置的条件则分配的值。

返回值

PySpark 列 (pyspark.sql.column.Column)。

例子

基本用法

考虑以下PySpark DataFrame:

df = spark.createDataFrame([["Alex", 20], ["Bob", 24], ["Cathy", 22]], ["name", "age"])
df.show()



+-----+---+
| name|age|
+-----+---+
| Alex| 20|
|  Bob| 24|
|Cathy| 22|
+-----+---+

要将名称 Alex 替换为 Doge ,将其他名称替换为 Eric

import pyspark.sql.functions as F
df.select(F.when(df.name == "Alex", "Doge").otherwise("Eric")).show()



+-----------------------------------------------+
|CASE WHEN (name = Alex) THEN Doge ELSE Eric END|
+-----------------------------------------------+
|                                           Doge|
|                                           Eric|
|                                           Eric|
+-----------------------------------------------+

请注意,我们可以用新列替换现有列,如下所示:

df.name = F.when(df.name == "Alex", "Doge").otherwise("Eric")
df.show()



+----+---+
|name|age|
+----+---+
|Doge| 25|
|Eric| 30|
|Eric| 50|
+----+---+

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark Column | otherwise method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。