Python pyflink TableEnvironment.from_pandas用法及代碼示例

本文簡要介紹 python 語言中 pyflink.table.TableEnvironment.from_pandas 的用法。

用法: from_pandas(pdf, schema: Union[pyflink.table.types.RowType, List[str], Tuple[str], List[pyflink.table.types.DataType], Tuple[pyflink.table.types.DataType]] = None, splits_num: int = 1) → pyflink.table.table.Table

從 pandas DataFrame 創建一個表。

例子：

>>> pdf = pd.DataFrame(np.random.rand(1000, 2))
# use the second parameter to specify custom field names
>>> table_env.from_pandas(pdf, ["a", "b"])
# use the second parameter to specify custom field types
>>> table_env.from_pandas(pdf, [DataTypes.DOUBLE(), DataTypes.DOUBLE()]))
# use the second parameter to specify custom table schema
>>> table_env.from_pandas(pdf,
...                       DataTypes.ROW([DataTypes.FIELD("a", DataTypes.DOUBLE()),
...                                      DataTypes.FIELD("b", DataTypes.DOUBLE())]))

參數：

pdf- Pandas DataFrame 。
schema- 轉換後的表的架構。
splits_num- 給定的 Pandas DataFrame 將被分割成的分割數。它決定了並行源任務的數量。如果未指定，將使用默認並行度。

返回：

結果表。

版本 1.11.0 中的新函數。

相關用法

注：本文由純淨天空篩選整理自apache.org大神的英文原創作品 pyflink.table.TableEnvironment.from_pandas。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。