当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark notnull用法及代码示例


本文简要介绍 pyspark.pandas.notnull 的用法。

用法:

pyspark.pandas.notnull(obj)

检测现有(非缺失)值。

返回一个布尔值相同大小的对象,指示值是否不是 NA。非缺失值被映射为 True。 NA 值,例如 None 或 numpy.NaN ,被映射到 False 值。

返回

bool 或类似 bool 的数组

每个元素的布尔值掩码,指示元素是否不是 NA 值。

例子

显示 DataFrame 中的哪些条目不是 NA。

>>> df = ps.DataFrame({'age': [5, 6, np.NaN],
...                    'born': [pd.NaT, pd.Timestamp('1939-05-27'),
...                             pd.Timestamp('1940-04-25')],
...                    'name': ['Alfred', 'Batman', ''],
...                    'toy': [None, 'Batmobile', 'Joker']})
>>> df
   age       born    name        toy
0  5.0        NaT  Alfred       None
1  6.0 1939-05-27  Batman  Batmobile
2  NaN 1940-04-25              Joker
>>> df.notnull()
     age   born  name    toy
0   True  False  True  False
1   True   True  True   True
2  False   True  True   True

显示 Series 中的哪些条目不是 NA。

>>> ser = ps.Series([5, 6, np.NaN])
>>> ser
0    5.0
1    6.0
2    NaN
dtype: float64
>>> ps.notna(ser)
0     True
1     True
2    False
dtype: bool
>>> ps.notna(ser.index)
True

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.notnull。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。