Python pyspark read_sql_query用法及代码示例

本文简要介绍 pyspark.pandas.read_sql_query 的用法。

用法:
pyspark.pandas.read_sql_query(sql: str, con: str, index_col: Union[str, List[str], None] = None, **options: Any) → pyspark.pandas.frame.DataFrame

将 SQL 查询读入 DataFrame。

返回与查询字符串的结果集对应的DataFrame。 (可选)提供 index_col 参数以使用其中一列作为索引，否则将使用默认索引。

注意

某些数据库可能会遇到 Spark 的问题：SPARK-27596

参数：

sql：字符串 SQL 查询: 要执行的 SQL 查询。
con：str: JDBC URI 可以作为 str 提供。

注意

URI 必须是 JDBC URI 而不是 Python 的数据库 URI。
index_col：字符串或字符串列表，可选，默认值：无: 要设置为索引(MultiIndex)的列。
options：dict: 所有其他选项直接传递到 Spark 的 JDBC 数据源。

DataFrame

例子：

>>> ps.read_sql_query('SELECT * FROM table_name', 'jdbc:postgresql:db_name')

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.read_sql_query。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

例子：