當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.sort_values用法及代碼示例


本文簡要介紹 pyspark.pandas.DataFrame.sort_values 的用法。

用法:

DataFrame.sort_values(by: Union[Any, Tuple[Any, …], List[Union[Any, Tuple[Any, …]]]], ascending: Union[bool, List[bool]] = True, inplace: bool = False, na_position: str = 'last') → Optional[pyspark.pandas.frame.DataFrame]

按任一軸上的值排序。

參數

bystr 或 str 列表
ascendingbool 或 bool 列表,默認為 True

升序與降序排序。指定多個排序順序的列表。如果這是一個布爾列表,則必須匹配 by 的長度。

inplace布爾值,默認為 False

如果為真,就地執行操作

na_position{‘first’, ‘last’},默認 ‘last’

first 將NaNs 放在開頭,last 將NaNs 放在結尾

返回

sorted_objDataFrame

例子

>>> df = ps.DataFrame({
...     'col1': ['A', 'B', None, 'D', 'C'],
...     'col2': [2, 9, 8, 7, 4],
...     'col3': [0, 9, 4, 2, 3],
...   },
...   columns=['col1', 'col2', 'col3'])
>>> df
   col1  col2  col3
0     A     2     0
1     B     9     9
2  None     8     4
3     D     7     2
4     C     4     3

按 col1 排序

>>> df.sort_values(by=['col1'])
   col1  col2  col3
0     A     2     0
1     B     9     9
4     C     4     3
3     D     7     2
2  None     8     4

降序排序

>>> df.sort_values(by='col1', ascending=False)
   col1  col2  col3
3     D     7     2
4     C     4     3
1     B     9     9
0     A     2     0
2  None     8     4

按多列排序

>>> df = ps.DataFrame({
...     'col1': ['A', 'A', 'B', None, 'D', 'C'],
...     'col2': [2, 1, 9, 8, 7, 4],
...     'col3': [0, 1, 9, 4, 2, 3],
...   },
...   columns=['col1', 'col2', 'col3'])
>>> df.sort_values(by=['col1', 'col2'])
   col1  col2  col3
1     A     1     1
0     A     2     0
2     B     9     9
5     C     4     3
4     D     7     2
3  None     8     4

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.sort_values。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。