当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyflink WindowedStream.reduce用法及代码示例


本文简要介绍 python 语言中 pyflink.datastream.WindowedStream.reduce 的用法。

用法:

reduce(reduce_function: Union[Callable, pyflink.datastream.functions.ReduceFunction], window_function: Union[pyflink.datastream.functions.WindowFunction, pyflink.datastream.functions.ProcessWindowFunction] = None, output_type: pyflink.common.typeinfo.TypeInformation = None) → pyflink.datastream.data_stream.DataStream

将reduce函数应用于窗口。每次对每个键的窗口进行评估时,都会调用窗口函数。 reduce 函数的输出被解释为常规的非窗口流。

此窗口将尝试在窗口策略允许的范围内逐步聚合数据。例如,翻滚时间窗口可以聚合数据,这意味着每个键只存储一个元素。滑动时间窗口将聚合滑动间隔的粒度,因此每个键存储几个元素(每个滑动间隔一个)。自定义窗口可能无法增量聚合,或者可能需要在聚合树中存储额外的值。

例子:

>>> ds.key_by(lambda x: x[1]) \
...     .window(TumblingEventTimeWindows.of(Time.seconds(5))) \
...     .reduce(lambda a, b: a[0] + b[0], b[1])

参数:

  • reduce_function- 减少函数。

  • window_function- 窗口函数。

  • output_type- 窗口函数的结果类型的类型信息。

返回:

将reduce函数应用于窗口的结果的数据流。

版本 1.16.0 中的新函数。

相关用法


注:本文由纯净天空筛选整理自apache.org大神的英文原创作品 pyflink.datastream.WindowedStream.reduce。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。