本文简要介绍
pyspark.sql.Column.eqNullSafe
的用法。用法:
Column.eqNullSafe(other)
对空值安全的等式测试。
2.3.0 版中的新函数。
- other:
一个值或
Column
参数:
注意:
与 Pandas 不同,PySpark 不认为 NaN 值为 NULL。有关详细信息,请参阅NaN Semantics。
例子:
>>> from pyspark.sql import Row >>> df1 = spark.createDataFrame([ ... Row(id=1, value='foo'), ... Row(id=2, value=None) ... ]) >>> df1.select( ... df1['value'] == 'foo', ... df1['value'].eqNullSafe('foo'), ... df1['value'].eqNullSafe(None) ... ).show() +-------------+---------------+----------------+ |(value = foo)|(value <=> foo)|(value <=> NULL)| +-------------+---------------+----------------+ | true| true| false| | null| false| true| +-------------+---------------+----------------+ >>> df2 = spark.createDataFrame([ ... Row(value = 'bar'), ... Row(value = None) ... ]) >>> df1.join(df2, df1["value"] == df2["value"]).count() 0 >>> df1.join(df2, df1["value"].eqNullSafe(df2["value"])).count() 1 >>> df2 = spark.createDataFrame([ ... Row(id=1, value=float('NaN')), ... Row(id=2, value=42.0), ... Row(id=3, value=None) ... ]) >>> df2.select( ... df2['value'].eqNullSafe(None), ... df2['value'].eqNullSafe(float('NaN')), ... df2['value'].eqNullSafe(42.0) ... ).show() +----------------+---------------+----------------+ |(value <=> NULL)|(value <=> NaN)|(value <=> 42.0)| +----------------+---------------+----------------+ | false| true| false| | false| false| true| | true| false| false| +----------------+---------------+----------------+
相关用法
- Python pyspark Column.endswith用法及代码示例
- Python pyspark Column.withField用法及代码示例
- Python pyspark Column.desc_nulls_first用法及代码示例
- Python pyspark Column.rlike用法及代码示例
- Python pyspark Column.substr用法及代码示例
- Python pyspark Column.when用法及代码示例
- Python pyspark Column.isNotNull用法及代码示例
- Python pyspark Column.bitwiseAND用法及代码示例
- Python pyspark Column.isNull用法及代码示例
- Python pyspark Column.between用法及代码示例
- Python pyspark Column.contains用法及代码示例
- Python pyspark Column.cast用法及代码示例
- Python pyspark Column.like用法及代码示例
- Python pyspark Column.asc_nulls_first用法及代码示例
- Python pyspark Column.getField用法及代码示例
- Python pyspark Column.isin用法及代码示例
- Python pyspark Column.dropFields用法及代码示例
- Python pyspark Column.bitwiseOR用法及代码示例
- Python pyspark Column.desc_nulls_last用法及代码示例
- Python pyspark Column.startswith用法及代码示例
- Python pyspark Column.bitwiseXOR用法及代码示例
- Python pyspark Column.asc_nulls_last用法及代码示例
- Python pyspark Column.otherwise用法及代码示例
- Python pyspark Column.desc用法及代码示例
- Python pyspark Column.getItem用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.Column.eqNullSafe。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。