當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyflink KeyedStream.min_by用法及代碼示例


本文簡要介紹 python 語言中 pyflink.datastream.KeyedStream.min_by 的用法。

用法:

min_by(position_to_min_by: Union[int, str] = 0) → pyflink.datastream.data_stream.DataStream

應用聚合,通過給定鍵在給定位置為當前元素提供最小值。每個鍵都保留一個獨立的聚合。如果更多元素在給定位置具有最小值,則運算符默認返回第一個。

示例(元組數據):

>>> ds = env.from_collection([('a', 1), ('a', 2), ('b', 1), ('b', 5)])
>>> ds.key_by(lambda x: x[0]).min_by(1)

示例(行數據):

>>> ds = env.from_collection([('a', 1), ('a', 2), ('a', 3), ('b', 1), ('b', 2)],
...                          type_info=Types.ROW([Types.STRING(), Types.INT()]))
>>> ds.key_by(lambda x: x[0]).min_by(1)

示例(具有字段名稱的行數據):

>>> ds = env.from_collection(
...     [('a', 1), ('a', 2), ('a', 3), ('b', 1), ('b', 2)],
...     type_info=Types.ROW_NAMED(["key", "value"], [Types.STRING(), Types.INT()])
... )
>>> ds.key_by(lambda x: x[0]).min_by("value")

參數:

position_to_min_by - 數據點中要最小化的字段位置。類型可以是int(字段位置)或str(字段名稱)。這適用於 Tuple 類型、List 類型、Row 類型和基本類型(被認為具有一個字段)。

返回:

轉換後的 DataStream。

版本 1.16.0 中的新函數。

相關用法


注:本文由純淨天空篩選整理自apache.org大神的英文原創作品 pyflink.datastream.KeyedStream.min_by。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。