當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark Series.mode用法及代碼示例


本文簡要介紹 pyspark.pandas.Series.mode 的用法。

用法:

Series.mode(dropna: bool = True) → pyspark.pandas.series.Series

返回數據集的模式。

即使隻返回一個值,也總是返回 Series。

參數

dropna布爾值,默認為真

不要考慮 NaN/NaT 的計數。

返回

Series

係列的模式。

例子

>>> s = ps.Series([0, 0, 1, 1, 1, np.nan, np.nan, np.nan])
>>> s
0    0.0
1    0.0
2    1.0
3    1.0
4    1.0
5    NaN
6    NaN
7    NaN
dtype: float64
>>> s.mode()
0    1.0
dtype: float64

如果有多個相同的模式,則顯示所有項目

>>> s = ps.Series([0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3,
...                np.nan, np.nan, np.nan])
>>> s
0     0.0
1     0.0
2     1.0
3     1.0
4     1.0
5     2.0
6     2.0
7     2.0
8     3.0
9     3.0
10    3.0
11    NaN
12    NaN
13    NaN
dtype: float64
>>> s.mode().sort_values()  

...  1.0
...  2.0
...  3.0
dtype: float64

將 ‘dropna’ 設置為“False”後,我們還可以在結果中看到NaN

>>> s.mode(False).sort_values()  

...  1.0
...  2.0
...  3.0
...  NaN
dtype: float64

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.mode。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。