用法:
class dask.dataframe.groupby.Aggregation(name, chunk, agg, finalize=None)
用戶定義groupby-aggregation。
這個類允許用戶在map-reduce 風格的 Pandas 數據幀上的操作方麵定義自己的自定義聚合。您需要指定對每個數據塊執行什麽操作,如何將這些數據塊組合在一起,以及如何最終確定結果。
有關更多信息,請參見聚合。
- name:str
聚合的名稱。它應該是唯一的,因為中間結果將由該名稱標識。
- chunk:可調用的
將使用每個分區的分組列調用的函數。它可以返回單個係列或係列的元組。索引必須等於組。
- agg:可調用的
將調用以聚合每個塊的結果的函數。同樣,參數將被分組係列。如果
chunk
返回一個元組,則將調用agg
並將它們全部作為單獨的位置參數。- finalize:可調用的
一個可選的終結器,將使用聚合的結果調用。
參數:
例子:
我們可以如下實現
sum
:>>> custom_sum = dd.Aggregation( ... name='custom_sum', ... chunk=lambda s: s.sum(), ... agg=lambda s0: s0.sum() ... ) >>> df.groupby('g').agg(custom_sum)
我們可以如下實現
mean
:>>> custom_mean = dd.Aggregation( ... name='custom_mean', ... chunk=lambda s: (s.count(), s.sum()), ... agg=lambda count, sum: (count.sum(), sum.sum()), ... finalize=lambda count, sum: sum / count, ... ) >>> df.groupby('g').agg(custom_mean)
當然,這兩個都是內置的,所以你不需要自己實現它們。
相關用法
- Python dask.dataframe.groupby.SeriesGroupBy.nunique用法及代碼示例
- Python dask.dataframe.groupby.SeriesGroupBy.rolling用法及代碼示例
- Python dask.dataframe.groupby.SeriesGroupBy.aggregate用法及代碼示例
- Python dask.dataframe.groupby.DataFrameGroupBy.corr用法及代碼示例
- Python dask.dataframe.groupby.DataFrameGroupBy.aggregate用法及代碼示例
- Python dask.dataframe.groupby.DataFrameGroupBy.idxmin用法及代碼示例
- Python dask.dataframe.groupby.DataFrameGroupBy.idxmax用法及代碼示例
- Python dask.dataframe.groupby.DataFrameGroupBy.cov用法及代碼示例
- Python dask.dataframe.groupby.SeriesGroupBy.cumcount用法及代碼示例
- Python dask.dataframe.groupby.DataFrameGroupBy.rolling用法及代碼示例
- Python dask.dataframe.groupby.DataFrameGroupBy.mean用法及代碼示例
- Python dask.dataframe.groupby.SeriesGroupBy.idxmin用法及代碼示例
- Python dask.dataframe.groupby.SeriesGroupBy.mean用法及代碼示例
- Python dask.dataframe.groupby.SeriesGroupBy.idxmax用法及代碼示例
- Python dask.dataframe.groupby.DataFrameGroupBy.cumcount用法及代碼示例
- Python dask.dataframe.Series.apply用法及代碼示例
- Python dask.dataframe.to_records用法及代碼示例
- Python dask.dataframe.DataFrame.applymap用法及代碼示例
- Python dask.dataframe.Series.clip用法及代碼示例
- Python dask.dataframe.Series.prod用法及代碼示例
注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.groupby.Aggregation。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。