當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrameWriter.sortBy用法及代碼示例


本文簡要介紹 pyspark.sql.DataFrameWriter.sortBy 的用法。

用法:

DataFrameWriter.sortBy(col, *cols)

按文件係統上的給定列對每個存儲桶中的輸出進行排序。

2.3.0 版中的新函數。

參數

colstr、元組或列表

列名或名稱列表。

colsstr

附加名稱(可選)。如果col 是一個列表,它應該是空的。

例子

>>> (df.write.format('parquet')  
...     .bucketBy(100, 'year', 'month')
...     .sortBy('day')
...     .mode("overwrite")
...     .saveAsTable('sorted_bucketed_table'))

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.DataFrameWriter.sortBy。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。