Python pyspark DataFrameWriter.json用法及代码示例

本文简要介绍 pyspark.sql.DataFrameWriter.json 的用法。

用法: DataFrameWriter.json(path, mode=None, compression=None, dateFormat=None, timestampFormat=None, lineSep=None, encoding=None, ignoreNullFields=None)

以 JSON 格式 (JSON Lines text format or newline-delimited JSON) 将 DataFrame 的内容保存在指定路径。

1.4.0 版中的新函数。

参数：

path：str

任何 Hadoop 支持的文件系统中的路径

mode：str，可选

指定数据已存在时保存操作的行为。

append ：将此 DataFrame 的内容附加到现有数据。
overwrite：覆盖现有数据。
ignore：如果数据已存在，则静默忽略此操作。
error 或 errorifexists(默认情况)：如果数据已经存在，则抛出异常。

其他参数：

Extra options：: 有关额外选项，请参阅您使用的版本中的Data Source Option。

例子：

>>> df.write.json(os.path.join(tempfile.mkdtemp(), 'data'))

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrameWriter.json。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。