本文简要介绍
pyspark.sql.DataFrameWriter.save
的用法。用法:
DataFrameWriter.save(path=None, format=None, mode=None, partitionBy=None, **options)
将
DataFrame
的内容保存到数据源。数据源由
format
和一组options
指定。如果不指定format
,则使用spark.sql.sources.default
配置的默认数据源。1.4.0 版中的新函数。
- path:str,可选
Hadoop 支持的文件系统中的路径
- format:str,可选
用于保存的格式
- mode:str,可选
指定数据已存在时保存操作的行为。
append
:将此DataFrame
的内容附加到现有数据。overwrite
:覆盖现有数据。ignore
:如果数据已存在,则静默忽略此操作。error
或errorifexists
(默认情况):如果数据已经存在,则抛出异常。
- partitionBy:列表,可选
分区列的名称
- **options:dict
所有其他字符串选项
参数:
例子:
>>> df.write.mode("append").save(os.path.join(tempfile.mkdtemp(), 'data'))
相关用法
- Python pyspark DataFrameWriter.sortBy用法及代码示例
- Python pyspark DataFrameWriter.partitionBy用法及代码示例
- Python pyspark DataFrameWriter.bucketBy用法及代码示例
- Python pyspark DataFrameWriter.parquet用法及代码示例
- Python pyspark DataFrameWriter.format用法及代码示例
- Python pyspark DataFrameWriter.csv用法及代码示例
- Python pyspark DataFrameWriter.orc用法及代码示例
- Python pyspark DataFrameWriter.mode用法及代码示例
- Python pyspark DataFrameWriter.json用法及代码示例
- Python pyspark DataFrame.to_latex用法及代码示例
- Python pyspark DataFrame.align用法及代码示例
- Python pyspark DataFrame.plot.bar用法及代码示例
- Python pyspark DataFrame.to_delta用法及代码示例
- Python pyspark DataFrame.quantile用法及代码示例
- Python pyspark DataFrame.cumsum用法及代码示例
- Python pyspark DataFrame.iloc用法及代码示例
- Python pyspark DataFrame.dropDuplicates用法及代码示例
- Python pyspark DataFrame.printSchema用法及代码示例
- Python pyspark DataFrame.to_table用法及代码示例
- Python pyspark DataFrame.rmod用法及代码示例
- Python pyspark DataFrame.div用法及代码示例
- Python pyspark DataFrame.drop_duplicates用法及代码示例
- Python pyspark DataFrame.to_pandas用法及代码示例
- Python pyspark DataFrame.sum用法及代码示例
- Python pyspark DataFrame.transform用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrameWriter.save。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。