当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyflink KeyedStream.max用法及代码示例


本文简要介绍 python 语言中 pyflink.datastream.KeyedStream.max 的用法。

用法:

max(position_to_max: Union[int, str] = 0) → pyflink.datastream.data_stream.DataStream

应用聚合,通过给定键在给定位置给出数据流的当前最大化。每个键都保留一个独立的聚合。

示例(元组数据):

>>> ds = env.from_collection([('a', 1), ('a', 2), ('b', 1), ('b', 5)])
>>> ds.key_by(lambda x: x[0]).max(1)

示例(行数据):

>>> ds = env.from_collection([('a', 1), ('a', 2), ('a', 3), ('b', 1), ('b', 2)],
...                          type_info=Types.ROW([Types.STRING(), Types.INT()]))
>>> ds.key_by(lambda x: x[0]).max(1)

示例(具有字段名称的行数据):

>>> ds = env.from_collection(
...     [('a', 1), ('a', 2), ('a', 3), ('b', 1), ('b', 2)],
...     type_info=Types.ROW_NAMED(["key", "value"], [Types.STRING(), Types.INT()])
... )
>>> ds.key_by(lambda x: x[0]).max("value")

参数:

position_to_max - 数据点中要最大化的字段位置。类型可以是int(字段位置)或str(字段名称)。这适用于 Tuple 类型、List 类型、Row 类型和基本类型(被认为具有一个字段)。

返回:

转换后的 DataStream。

版本 1.16.0 中的新函数。

相关用法


注:本文由纯净天空筛选整理自apache.org大神的英文原创作品 pyflink.datastream.KeyedStream.max。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。