Python pyspark DataFrameWriter.save用法及代码示例

本文简要介绍 pyspark.sql.DataFrameWriter.save 的用法。

用法:
DataFrameWriter.save(path=None, format=None, mode=None, partitionBy=None, **options)

将 DataFrame 的内容保存到数据源。

数据源由 format 和一组 options 指定。如果不指定format，则使用spark.sql.sources.default配置的默认数据源。

1.4.0 版中的新函数。

path：str，可选

Hadoop 支持的文件系统中的路径

format：str，可选

用于保存的格式

mode：str，可选

指定数据已存在时保存操作的行为。

partitionBy：列表，可选

分区列的名称

**options：dict

所有其他字符串选项

>>> df.write.mode("append").save(os.path.join(tempfile.mkdtemp(), 'data'))

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrameWriter.save。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。