本文简要介绍 python 语言中pyflink.datastream.WindowedStream.side_output_late_data
的用法。
用法:
side_output_late_data(output_tag: pyflink.datastream.output_tag.OutputTag)
将迟到的数据发送到由给定
OutputTag
标识的侧输出。在水印超过窗口末尾加上使用allowed_lateness()
设置的允许延迟后,数据被视为延迟。您可以使用
get_side_output()
在DataStream
上使用get_side_output()
获取由相同OutputTag
的窗口操作产生的延迟数据流。例子:
>>> tag = OutputTag("late-data", Types.TUPLE([Types.INT(), Types.STRING()])) >>> main_stream = ds.key_by(lambda x: x[1]) \ ... .window(TumblingEventTimeWindows.of(Time.seconds(5))) \ ... .side_output_late_data(tag) \ ... .reduce(lambda a, b: a[0] + b[0], b[1]) >>> late_stream = main_stream.get_side_output(tag)
版本 1.16.0 中的新函数。
相关用法
- Python pyflink WindowedStream.reduce用法及代码示例
- Python pyflink WindowedStream.aggregate用法及代码示例
- Python pyflink WindowGroupedTable.aggregate用法及代码示例
- Python pyflink WindowGroupedTable.select用法及代码示例
- Python pyflink WatermarkStrategy.with_timestamp_assigner用法及代码示例
- Python pyflink Table.intersect_all用法及代码示例
- Python pyflink GroupedTable.select用法及代码示例
- Python pyflink StreamTableEnvironment.from_data_stream用法及代码示例
- Python pyflink Expression.to_date用法及代码示例
- Python pyflink Table.fetch用法及代码示例
- Python pyflink PulsarSourceBuilder用法及代码示例
- Python pyflink TableEnvironment.create_temporary_function用法及代码示例
- Python pyflink Table.right_outer_join用法及代码示例
- Python pyflink Expression.json_value用法及代码示例
- Python pyflink Table.distinct用法及代码示例
- Python pyflink TableEnvironment.register_table_source用法及代码示例
- Python pyflink Table.where用法及代码示例
- Python pyflink Expression.end用法及代码示例
- Python pyflink lit用法及代码示例
- Python pyflink TableEnvironment.create_java_temporary_function用法及代码示例
- Python pyflink Row.as_dict用法及代码示例
- Python pyflink StreamTableEnvironment.create用法及代码示例
- Python pyflink Table.drop_columns用法及代码示例
- Python pyflink Expression.over用法及代码示例
- Python pyflink Table.execute用法及代码示例
注:本文由纯净天空筛选整理自apache.org大神的英文原创作品 pyflink.datastream.WindowedStream.side_output_late_data。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。