当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyflink TableEnvironment.from_pandas用法及代码示例


本文简要介绍 python 语言中 pyflink.table.TableEnvironment.from_pandas 的用法。

用法:

from_pandas(pdf, schema: Union[pyflink.table.types.RowType, List[str], Tuple[str], List[pyflink.table.types.DataType], Tuple[pyflink.table.types.DataType]] = None, splits_num: int = 1) → pyflink.table.table.Table

从 pandas DataFrame 创建一个表。

例子:

>>> pdf = pd.DataFrame(np.random.rand(1000, 2))
# use the second parameter to specify custom field names
>>> table_env.from_pandas(pdf, ["a", "b"])
# use the second parameter to specify custom field types
>>> table_env.from_pandas(pdf, [DataTypes.DOUBLE(), DataTypes.DOUBLE()]))
# use the second parameter to specify custom table schema
>>> table_env.from_pandas(pdf,
...                       DataTypes.ROW([DataTypes.FIELD("a", DataTypes.DOUBLE()),
...                                      DataTypes.FIELD("b", DataTypes.DOUBLE())]))

参数:

  • pdf- Pandas DataFrame 。

  • schema- 转换后的表的架构。

  • splits_num- 给定的 Pandas DataFrame 将被分割成的分割数。它决定了并行源任务的数量。如果未指定,将使用默认并行度。

返回:

结果表。

版本 1.11.0 中的新函数。

相关用法


注:本文由纯净天空筛选整理自apache.org大神的英文原创作品 pyflink.table.TableEnvironment.from_pandas。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。