本文簡要介紹
pyspark.sql.DataFrameWriter.parquet
的用法。用法:
DataFrameWriter.parquet(path, mode=None, partitionBy=None, compression=None)
將
DataFrame
的內容以 Parquet 格式保存在指定路徑。1.4.0 版中的新函數。
- path:str
任何 Hadoop 支持的文件係統中的路徑
- mode:str,可選
指定數據已存在時保存操作的行為。
append
:將此DataFrame
的內容附加到現有數據。overwrite
:覆蓋現有數據。ignore
:如果數據已存在,則靜默忽略此操作。error
或errorifexists
(默認情況):如果數據已經存在,則拋出異常。
- partitionBy:str 或列表,可選
分區列的名稱
- Extra options:
有關額外選項,請參閱您使用的版本中的Data Source Option。
參數:
其他參數:
例子:
>>> df.write.parquet(os.path.join(tempfile.mkdtemp(), 'data'))
相關用法
- Python pyspark DataFrameWriter.partitionBy用法及代碼示例
- Python pyspark DataFrameWriter.bucketBy用法及代碼示例
- Python pyspark DataFrameWriter.format用法及代碼示例
- Python pyspark DataFrameWriter.sortBy用法及代碼示例
- Python pyspark DataFrameWriter.csv用法及代碼示例
- Python pyspark DataFrameWriter.orc用法及代碼示例
- Python pyspark DataFrameWriter.mode用法及代碼示例
- Python pyspark DataFrameWriter.save用法及代碼示例
- Python pyspark DataFrameWriter.json用法及代碼示例
- Python pyspark DataFrame.to_latex用法及代碼示例
- Python pyspark DataFrame.align用法及代碼示例
- Python pyspark DataFrame.plot.bar用法及代碼示例
- Python pyspark DataFrame.to_delta用法及代碼示例
- Python pyspark DataFrame.quantile用法及代碼示例
- Python pyspark DataFrame.cumsum用法及代碼示例
- Python pyspark DataFrame.iloc用法及代碼示例
- Python pyspark DataFrame.dropDuplicates用法及代碼示例
- Python pyspark DataFrame.printSchema用法及代碼示例
- Python pyspark DataFrame.to_table用法及代碼示例
- Python pyspark DataFrame.rmod用法及代碼示例
- Python pyspark DataFrame.div用法及代碼示例
- Python pyspark DataFrame.drop_duplicates用法及代碼示例
- Python pyspark DataFrame.to_pandas用法及代碼示例
- Python pyspark DataFrame.sum用法及代碼示例
- Python pyspark DataFrame.transform用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.DataFrameWriter.parquet。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。