当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark Column isNotNull方法用法及代码示例


PySpark 列的isNotNull() 方法标识值不为空的行。

返回值

PySpark 列 (pyspark.sql.column.Column)。

例子

考虑以下PySpark DataFrame:

df = spark.createDataFrame([["Alex", 25], ["Bob", 30], ["Cathy", None]], ["name", "age"])
df.show()



+-----+----+
| name| age|
+-----+----+
| Alex|  25|
|  Bob|  30|
|Cathy|null|
+-----+----+

识别 PySpark DataFrame 中某些值不为空的行

要识别 age 的值不是 null 的行:

df.select(df.age.isNotNull()).show()



+-------------+
|(age IS NULL)|
+-------------+
|        false|
|        false|
|         true|
+-------------+

获取 PySpark DataFrame 中特定值不为空的行

要获取 age 字段不是 null 的行:

df.filter(df.age.isNotNull()).show()



+----+---+
|name|age|
+----+---+
|Alex| 25|
| Bob| 30|
+----+---+

此处, filter(~) 提取与isNotNull() 方法返回的布尔列中的True 对应的行。

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark Column | isNotNull method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。