當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark isnull用法及代碼示例


本文簡要介紹 pyspark.pandas.isnull 的用法。

用法:

pyspark.pandas.isnull(obj)

檢測類似數組的對象的缺失值。

此函數采用標量或類似數組的對象,並指示是否缺少值(數值數組中的 NaN,對象數組中的 NoneNaN)。

參數

obj標量或類數組

檢查空值或缺失值的對象。

返回

bool 或類似 bool 的數組

對於標量輸入,返回標量布爾值。對於數組輸入,返回一個布爾數組,指示是否缺少每個相應的元素。

例子

標量參數(包括字符串)產生標量布爾值。

>>> ps.isna('dog')
False
>>> ps.isna(np.nan)
True

ndarrays 產生一個布爾值的 ndarray。

>>> array = np.array([[1, np.nan, 3], [4, 5, np.nan]])
>>> array
array([[ 1., nan,  3.],
       [ 4.,  5., nan]])
>>> ps.isna(array)
array([[False,  True, False],
       [False, False,  True]])

對於 Series 和 DataFrame,返回相同的類型,包含布爾值。

>>> df = ps.DataFrame({'a': ['ant', 'bee', 'cat'], 'b': ['dog', None, 'fly']})
>>> df
     a     b
0  ant   dog
1  bee  None
2  cat   fly
>>> ps.isna(df)
       a      b
0  False  False
1  False   True
2  False  False
>>> ps.isnull(df.b)
0    False
1     True
2    False
Name: b, dtype: bool

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.isnull。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。