当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark isnull用法及代码示例


本文简要介绍 pyspark.pandas.isnull 的用法。

用法:

pyspark.pandas.isnull(obj)

检测类似数组的对象的缺失值。

此函数采用标量或类似数组的对象,并指示是否缺少值(数值数组中的 NaN,对象数组中的 NoneNaN)。

参数

obj标量或类数组

检查空值或缺失值的对象。

返回

bool 或类似 bool 的数组

对于标量输入,返回标量布尔值。对于数组输入,返回一个布尔数组,指示是否缺少每个相应的元素。

例子

标量参数(包括字符串)产生标量布尔值。

>>> ps.isna('dog')
False
>>> ps.isna(np.nan)
True

ndarrays 产生一个布尔值的 ndarray。

>>> array = np.array([[1, np.nan, 3], [4, 5, np.nan]])
>>> array
array([[ 1., nan,  3.],
       [ 4.,  5., nan]])
>>> ps.isna(array)
array([[False,  True, False],
       [False, False,  True]])

对于 Series 和 DataFrame,返回相同的类型,包含布尔值。

>>> df = ps.DataFrame({'a': ['ant', 'bee', 'cat'], 'b': ['dog', None, 'fly']})
>>> df
     a     b
0  ant   dog
1  bee  None
2  cat   fly
>>> ps.isna(df)
       a      b
0  False  False
1  False   True
2  False  False
>>> ps.isnull(df.b)
0    False
1     True
2    False
Name: b, dtype: bool

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.isnull。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。