当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrameWriter.sortBy用法及代码示例


本文简要介绍 pyspark.sql.DataFrameWriter.sortBy 的用法。

用法:

DataFrameWriter.sortBy(col, *cols)

按文件系统上的给定列对每个存储桶中的输出进行排序。

2.3.0 版中的新函数。

参数

colstr、元组或列表

列名或名称列表。

colsstr

附加名称(可选)。如果col 是一个列表,它应该是空的。

例子

>>> (df.write.format('parquet')  
...     .bucketBy(100, 'year', 'month')
...     .sortBy('day')
...     .mode("overwrite")
...     .saveAsTable('sorted_bucketed_table'))

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrameWriter.sortBy。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。