当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyflink WindowedStream.side_output_late_data用法及代码示例


本文简要介绍 python 语言中pyflink.datastream.WindowedStream.side_output_late_data的用法。

用法:

side_output_late_data(output_tag: pyflink.datastream.output_tag.OutputTag)

将迟到的数据发送到由给定 OutputTag 标识的侧输出。在水印超过窗口末尾加上使用 allowed_lateness() 设置的允许延迟后,数据被视为延迟。

您可以使用 get_side_output()DataStream 上使用 get_side_output() 获取由相同 OutputTag 的窗口操作产生的延迟数据流。

例子:

>>> tag = OutputTag("late-data", Types.TUPLE([Types.INT(), Types.STRING()]))
>>> main_stream = ds.key_by(lambda x: x[1]) \
...                 .window(TumblingEventTimeWindows.of(Time.seconds(5))) \
...                 .side_output_late_data(tag) \
...                 .reduce(lambda a, b: a[0] + b[0], b[1])
>>> late_stream = main_stream.get_side_output(tag)

版本 1.16.0 中的新函数。

相关用法


注:本文由纯净天空筛选整理自apache.org大神的英文原创作品 pyflink.datastream.WindowedStream.side_output_late_data。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。