當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark sort_array用法及代碼示例


本文簡要介紹 pyspark.sql.functions.sort_array 的用法。

用法:

pyspark.sql.functions.sort_array(col, asc=True)

集合函數:根據數組元素的自然順序對輸入數組進行升序或降序排序。空元素將按升序放置在返回數組的開頭或按降序放置在返回數組的末尾。

1.5.0 版中的新函數。

參數

col Column 或 str

列或表達式的名稱

asc布爾型,可選

例子

>>> df = spark.createDataFrame([([2, 1, None, 3],),([1],),([],)], ['data'])
>>> df.select(sort_array(df.data).alias('r')).collect()
[Row(r=[None, 1, 2, 3]), Row(r=[1]), Row(r=[])]
>>> df.select(sort_array(df.data, asc=False).alias('r')).collect()
[Row(r=[3, 2, 1, None]), Row(r=[1]), Row(r=[])]

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.functions.sort_array。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。