当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.dataframe.groupby.SeriesGroupBy.mean用法及代码示例


用法:

SeriesGroupBy.mean(split_every=None, split_out=1)

计算组的平均值,不包括缺失值。

此文档字符串是从 pandas.core.groupby.groupby.GroupBy.mean 复制而来的。

可能存在与 Dask 版本的一些不一致之处。

参数

numeric_onlybool,默认 True(Dask 中不支持)

仅包括 float、int、boolean 列。如果没有,将尝试使用所有内容,然后仅使用数字数据。

enginestr,默认无(在 Dask 中不支持)
  • 'cython' :通过 cython 的 C-extensions 运行操作。
  • 'numba' :通过来自 numba 的 JIT 编译代码运行操作。
  • None :默认为 'cython' 或全局设置 compute.use_numba
engine_kwargsdict,默认无(在 Dask 中不支持)
  • 对于'cython' 引擎,没有接受的engine_kwargs
  • 对于'numba' 引擎,引擎可以接受nopython , nogilparallel 字典键。这些值必须是 TrueFalse'numba' 引擎的默认 engine_kwargs{{'nopython': True, 'nogil': False, 'parallel': False}}

返回

pandas.Series 或 pandas.DataFrame

例子

>>> df = pd.DataFrame({'A': [1, 1, 2, 1, 2],  
...                    'B': [np.nan, 2, 3, 4, 5],
...                    'C': [1, 2, 1, 1, 2]}, columns=['A', 'B', 'C'])

Groupby 一列并返回每组中剩余列的平均值。

>>> df.groupby('A').mean()  
     B         C
A
1  3.0  1.333333
2  4.0  1.500000

Groupby 两列并返回剩余列的平均值。

>>> df.groupby(['A', 'B']).mean()  
         C
A B
1 2.0  2.0
  4.0  1.0
2 3.0  1.0
  5.0  2.0

按一列分组并返回组中唯一特定列的平均值。

>>> df.groupby('A')['B'].mean()  
A
1    3.0
2    4.0
Name: B, dtype: float64

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.groupby.SeriesGroupBy.mean。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。