当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.mode用法及代码示例


本文简要介绍 pyspark.pandas.Series.mode 的用法。

用法:

Series.mode(dropna: bool = True) → pyspark.pandas.series.Series

返回数据集的模式。

即使只返回一个值,也总是返回 Series。

参数

dropna布尔值,默认为真

不要考虑 NaN/NaT 的计数。

返回

Series

系列的模式。

例子

>>> s = ps.Series([0, 0, 1, 1, 1, np.nan, np.nan, np.nan])
>>> s
0    0.0
1    0.0
2    1.0
3    1.0
4    1.0
5    NaN
6    NaN
7    NaN
dtype: float64
>>> s.mode()
0    1.0
dtype: float64

如果有多个相同的模式,则显示所有项目

>>> s = ps.Series([0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3,
...                np.nan, np.nan, np.nan])
>>> s
0     0.0
1     0.0
2     1.0
3     1.0
4     1.0
5     2.0
6     2.0
7     2.0
8     3.0
9     3.0
10    3.0
11    NaN
12    NaN
13    NaN
dtype: float64
>>> s.mode().sort_values()  

...  1.0
...  2.0
...  3.0
dtype: float64

将 ‘dropna’ 设置为“False”后,我们还可以在结果中看到NaN

>>> s.mode(False).sort_values()  

...  1.0
...  2.0
...  3.0
...  NaN
dtype: float64

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.mode。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。