当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark MultiIndex.dropna用法及代码示例


本文简要介绍 pyspark.pandas.MultiIndex.dropna 的用法。

用法:

MultiIndex.dropna() → pyspark.pandas.indexes.base.Index

返回索引或MultiIndex,不带 NA/NaN 值

例子

>>> df = ps.DataFrame([[1, 2], [4, 5], [7, 8]],
...                   index=['cobra', 'viper', None],
...                   columns=['max_speed', 'shield'])
>>> df
       max_speed  shield
cobra          1       2
viper          4       5
NaN            7       8
>>> df.index.dropna()
Index(['cobra', 'viper'], dtype='object')

还支持MultiIndex

>>> midx = pd.MultiIndex([['lama', 'cow', 'falcon'],
...                       [None, 'weight', 'length']],
...                      [[0, 1, 1, 1, 1, 1, 2, 2, 2],
...                       [0, 1, 1, 0, 1, 2, 1, 1, 2]])
>>> s = ps.Series([45, 200, 1.2, 30, 250, 1.5, 320, 1, None],
...               index=midx)
>>> s
lama    NaN        45.0
cow     weight    200.0
        weight      1.2
        NaN        30.0
        weight    250.0
        length      1.5
falcon  weight    320.0
        weight      1.0
        length      NaN
dtype: float64
>>> s.index.dropna()  
MultiIndex([(   'cow', 'weight'),
            (   'cow', 'weight'),
            (   'cow', 'weight'),
            (   'cow', 'length'),
            ('falcon', 'weight'),
            ('falcon', 'weight'),
            ('falcon', 'length')],
           )

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.MultiIndex.dropna。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。