Python pyspark DataFrameWriter.csv用法及代码示例

本文简要介绍 pyspark.sql.DataFrameWriter.csv 的用法。

用法: DataFrameWriter.csv(path, mode=None, compression=None, sep=None, quote=None, escape=None, header=None, nullValue=None, escapeQuotes=None, quoteAll=None, dateFormat=None, timestampFormat=None, ignoreLeadingWhiteSpace=None, ignoreTrailingWhiteSpace=None, charToEscapeQuoteEscaping=None, encoding=None, emptyValue=None, lineSep=None)

将 DataFrame 的内容以 CSV 格式保存在指定路径。

2.0.0 版中的新函数。

参数：

path：str

任何 Hadoop 支持的文件系统中的路径

mode：str，可选

指定数据已存在时保存操作的行为。

append ：将此 DataFrame 的内容附加到现有数据。
overwrite：覆盖现有数据。
ignore：如果数据已存在，则静默忽略此操作。
error 或 errorifexists(默认情况)：如果数据已经有则抛出异常
存在。

其他参数：

Extra options：: 有关额外选项，请参阅您使用的版本中的Data Source Option。

例子：

>>> df.write.csv(os.path.join(tempfile.mkdtemp(), 'data'))

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrameWriter.csv。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。