本文簡要介紹
pyspark.sql.DataFrameWriter.save
的用法。用法:
DataFrameWriter.save(path=None, format=None, mode=None, partitionBy=None, **options)
將
DataFrame
的內容保存到數據源。數據源由
format
和一組options
指定。如果不指定format
,則使用spark.sql.sources.default
配置的默認數據源。1.4.0 版中的新函數。
- path:str,可選
Hadoop 支持的文件係統中的路徑
- format:str,可選
用於保存的格式
- mode:str,可選
指定數據已存在時保存操作的行為。
append
:將此DataFrame
的內容附加到現有數據。overwrite
:覆蓋現有數據。ignore
:如果數據已存在,則靜默忽略此操作。error
或errorifexists
(默認情況):如果數據已經存在,則拋出異常。
- partitionBy:列表,可選
分區列的名稱
- **options:dict
所有其他字符串選項
參數:
例子:
>>> df.write.mode("append").save(os.path.join(tempfile.mkdtemp(), 'data'))
相關用法
- Python pyspark DataFrameWriter.sortBy用法及代碼示例
- Python pyspark DataFrameWriter.partitionBy用法及代碼示例
- Python pyspark DataFrameWriter.bucketBy用法及代碼示例
- Python pyspark DataFrameWriter.parquet用法及代碼示例
- Python pyspark DataFrameWriter.format用法及代碼示例
- Python pyspark DataFrameWriter.csv用法及代碼示例
- Python pyspark DataFrameWriter.orc用法及代碼示例
- Python pyspark DataFrameWriter.mode用法及代碼示例
- Python pyspark DataFrameWriter.json用法及代碼示例
- Python pyspark DataFrame.to_latex用法及代碼示例
- Python pyspark DataFrame.align用法及代碼示例
- Python pyspark DataFrame.plot.bar用法及代碼示例
- Python pyspark DataFrame.to_delta用法及代碼示例
- Python pyspark DataFrame.quantile用法及代碼示例
- Python pyspark DataFrame.cumsum用法及代碼示例
- Python pyspark DataFrame.iloc用法及代碼示例
- Python pyspark DataFrame.dropDuplicates用法及代碼示例
- Python pyspark DataFrame.printSchema用法及代碼示例
- Python pyspark DataFrame.to_table用法及代碼示例
- Python pyspark DataFrame.rmod用法及代碼示例
- Python pyspark DataFrame.div用法及代碼示例
- Python pyspark DataFrame.drop_duplicates用法及代碼示例
- Python pyspark DataFrame.to_pandas用法及代碼示例
- Python pyspark DataFrame.sum用法及代碼示例
- Python pyspark DataFrame.transform用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.DataFrameWriter.save。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。