Python pyspark DataStreamReader.parquet用法及代码示例

本文简要介绍 pyspark.sql.streaming.DataStreamReader.parquet 的用法。

用法: DataStreamReader.parquet(path, mergeSchema=None, pathGlobFilter=None, recursiveFileLookup=None, datetimeRebaseMode=None, int96RebaseMode=None)

加载 Parquet 文件流，将结果作为 DataFrame 返回。

2.0.0 版中的新函数。

参数：

path：str: 任何 Hadoop 支持的文件系统中的路径

其他参数：

Extra options：: 有关额外选项，请参阅Data Source Option。在您使用的版本中。

例子：

>>> parquet_sdf = spark.readStream.schema(sdf_schema).parquet(tempfile.mkdtemp())
>>> parquet_sdf.isStreaming
True
>>> parquet_sdf.schema == sdf_schema
True

相关用法

Python pyspark DataStreamReader.schema用法及代码示例
Python pyspark DataStreamReader.text用法及代码示例
Python pyspark DataStreamReader.option用法及代码示例
Python pyspark DataStreamReader.json用法及代码示例
Python pyspark DataStreamReader.orc用法及代码示例
Python pyspark DataStreamReader.options用法及代码示例
Python pyspark DataStreamReader.load用法及代码示例
Python pyspark DataStreamReader.csv用法及代码示例
Python pyspark DataStreamReader.format用法及代码示例
Python pyspark DataStreamWriter.foreach用法及代码示例
Python pyspark DataStreamWriter.queryName用法及代码示例
Python pyspark DataStreamWriter.foreachBatch用法及代码示例
Python pyspark DataStreamWriter.outputMode用法及代码示例
Python pyspark DataStreamWriter.format用法及代码示例
Python pyspark DataStreamWriter.start用法及代码示例
Python pyspark DataStreamWriter.trigger用法及代码示例
Python pyspark DataFrame.to_latex用法及代码示例
Python pyspark DataFrame.align用法及代码示例
Python pyspark DataFrame.plot.bar用法及代码示例
Python pyspark DataFrame.to_delta用法及代码示例
Python pyspark DataFrame.quantile用法及代码示例
Python pyspark DataFrameWriter.partitionBy用法及代码示例
Python pyspark DataFrame.cumsum用法及代码示例
Python pyspark DataFrame.iloc用法及代码示例
Python pyspark DataFrame.dropDuplicates用法及代码示例

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.streaming.DataStreamReader.parquet。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。