當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyflink TableEnvironment.from_pandas用法及代碼示例


本文簡要介紹 python 語言中 pyflink.table.TableEnvironment.from_pandas 的用法。

用法:

from_pandas(pdf, schema: Union[pyflink.table.types.RowType, List[str], Tuple[str], List[pyflink.table.types.DataType], Tuple[pyflink.table.types.DataType]] = None, splits_num: int = 1) → pyflink.table.table.Table

從 pandas DataFrame 創建一個表。

例子:

>>> pdf = pd.DataFrame(np.random.rand(1000, 2))
# use the second parameter to specify custom field names
>>> table_env.from_pandas(pdf, ["a", "b"])
# use the second parameter to specify custom field types
>>> table_env.from_pandas(pdf, [DataTypes.DOUBLE(), DataTypes.DOUBLE()]))
# use the second parameter to specify custom table schema
>>> table_env.from_pandas(pdf,
...                       DataTypes.ROW([DataTypes.FIELD("a", DataTypes.DOUBLE()),
...                                      DataTypes.FIELD("b", DataTypes.DOUBLE())]))

參數:

  • pdf- Pandas DataFrame 。

  • schema- 轉換後的表的架構。

  • splits_num- 給定的 Pandas DataFrame 將被分割成的分割數。它決定了並行源任務的數量。如果未指定,將使用默認並行度。

返回:

結果表。

版本 1.11.0 中的新函數。

相關用法


注:本文由純淨天空篩選整理自apache.org大神的英文原創作品 pyflink.table.TableEnvironment.from_pandas。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。