當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyflink KeyedStream.sum用法及代碼示例

本文簡要介紹 python 語言中 pyflink.datastream.KeyedStream.sum 的用法。

用法:

sum(position_to_sum: Union[int, str] = 0) → pyflink.datastream.data_stream.DataStream

應用一個聚合,該聚合給出在給定位置按給定鍵分組的數據流的滾動總和。每個鍵都保留一個獨立的聚合。

示例(要求和的元組數據):

>>> ds = env.from_collection([('a', 1), ('a', 2), ('b', 1), ('b', 5)])
>>> ds.key_by(lambda x: x[0]).sum(1)

示例(要匯總的行數據):

>>> ds = env.from_collection([('a', 1), ('a', 2), ('a', 3), ('b', 1), ('b', 2)],
...                          type_info=Types.ROW([Types.STRING(), Types.INT()]))
>>> ds.key_by(lambda x: x[0]).sum(1)

示例(具有要匯總的字段名稱的行數據):

>>> ds = env.from_collection(
...     [('a', 1), ('a', 2), ('a', 3), ('b', 1), ('b', 2)],
...     type_info=Types.ROW_NAMED(["key", "value"], [Types.STRING(), Types.INT()])
... )
>>> ds.key_by(lambda x: x[0]).sum("value")

參數:

position_to_sum - 數據中的字段位置指向求和,類型可以是int,表示要操作的列的索引或str,表示要操作的列的名稱。

返回:

轉換後的 DataStream。

版本 1.16.0 中的新函數。

相關用法


注:本文由純淨天空篩選整理自apache.org大神的英文原創作品 pyflink.datastream.KeyedStream.sum。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。