當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyflink WindowedStream.side_output_late_data用法及代碼示例

本文簡要介紹 python 語言中pyflink.datastream.WindowedStream.side_output_late_data的用法。

用法:

side_output_late_data(output_tag: pyflink.datastream.output_tag.OutputTag)

將遲到的數據發送到由給定 OutputTag 標識的側輸出。在水印超過窗口末尾加上使用 allowed_lateness() 設置的允許延遲後,數據被視為延遲。

您可以使用 get_side_output()DataStream 上使用 get_side_output() 獲取由相同 OutputTag 的窗口操作產生的延遲數據流。

例子:

>>> tag = OutputTag("late-data", Types.TUPLE([Types.INT(), Types.STRING()]))
>>> main_stream = ds.key_by(lambda x: x[1]) \
...                 .window(TumblingEventTimeWindows.of(Time.seconds(5))) \
...                 .side_output_late_data(tag) \
...                 .reduce(lambda a, b: a[0] + b[0], b[1])
>>> late_stream = main_stream.get_side_output(tag)

版本 1.16.0 中的新函數。

相關用法


注:本文由純淨天空篩選整理自apache.org大神的英文原創作品 pyflink.datastream.WindowedStream.side_output_late_data。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。