當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python dask.dataframe.groupby.SeriesGroupBy.mean用法及代碼示例


用法:

SeriesGroupBy.mean(split_every=None, split_out=1)

計算組的平均值,不包括缺失值。

此文檔字符串是從 pandas.core.groupby.groupby.GroupBy.mean 複製而來的。

可能存在與 Dask 版本的一些不一致之處。

參數

numeric_onlybool,默認 True(Dask 中不支持)

僅包括 float、int、boolean 列。如果沒有,將嘗試使用所有內容,然後僅使用數字數據。

enginestr,默認無(在 Dask 中不支持)
  • 'cython' :通過 cython 的 C-extensions 運行操作。
  • 'numba' :通過來自 numba 的 JIT 編譯代碼運行操作。
  • None :默認為 'cython' 或全局設置 compute.use_numba
engine_kwargsdict,默認無(在 Dask 中不支持)
  • 對於'cython' 引擎,沒有接受的engine_kwargs
  • 對於'numba' 引擎,引擎可以接受nopython , nogilparallel 字典鍵。這些值必須是 TrueFalse'numba' 引擎的默認 engine_kwargs{{'nopython': True, 'nogil': False, 'parallel': False}}

返回

pandas.Series 或 pandas.DataFrame

例子

>>> df = pd.DataFrame({'A': [1, 1, 2, 1, 2],  
...                    'B': [np.nan, 2, 3, 4, 5],
...                    'C': [1, 2, 1, 1, 2]}, columns=['A', 'B', 'C'])

Groupby 一列並返回每組中剩餘列的平均值。

>>> df.groupby('A').mean()  
     B         C
A
1  3.0  1.333333
2  4.0  1.500000

Groupby 兩列並返回剩餘列的平均值。

>>> df.groupby(['A', 'B']).mean()  
         C
A B
1 2.0  2.0
  4.0  1.0
2 3.0  1.0
  5.0  2.0

按一列分組並返回組中唯一特定列的平均值。

>>> df.groupby('A')['B'].mean()  
A
1    3.0
2    4.0
Name: B, dtype: float64

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.groupby.SeriesGroupBy.mean。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。