当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark read_sql_query用法及代码示例


本文简要介绍 pyspark.pandas.read_sql_query 的用法。

用法:

pyspark.pandas.read_sql_query(sql: str, con: str, index_col: Union[str, List[str], None] = None, **options: Any) → pyspark.pandas.frame.DataFrame

将 SQL 查询读入 DataFrame。

返回与查询字符串的结果集对应的DataFrame。 (可选)提供 index_col 参数以使用其中一列作为索引,否则将使用默认索引。

注意

某些数据库可能会遇到 Spark 的问题:SPARK-27596

参数

sql字符串 SQL 查询

要执行的 SQL 查询。

constr

JDBC URI 可以作为 str 提供。

注意

URI 必须是 JDBC URI 而不是 Python 的数据库 URI。

index_col字符串或字符串列表,可选,默认值:无

要设置为索引(MultiIndex)的列。

optionsdict

所有其他选项直接传递到 Spark 的 JDBC 数据源。

返回

DataFrame

例子

>>> ps.read_sql_query('SELECT * FROM table_name', 'jdbc:postgresql:db_name')

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.read_sql_query。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。