當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.sort_index用法及代碼示例


本文簡要介紹 pyspark.pandas.DataFrame.sort_index 的用法。

用法:

DataFrame.sort_index(axis: Union[int, str] = 0, level: Union[int, List[int], None] = None, ascending: bool = True, inplace: bool = False, kind: str = None, na_position: str = 'last') → Optional[pyspark.pandas.frame.DataFrame]

按標簽排序對象(沿軸)

參數

axis索引,列直接排序。目前,僅支持axis = 0。
levelint 或級別名稱或整數列表或級別名稱列表

如果不是無,則對指定索引級別的值進行排序

ascending布爾值,默認 True

升序與降序排序

inplace布爾值,默認為 False

如果為真,就地執行操作

kindstr,默認無

pandas-on-Spark目前不允許指定排序算法,默認無

na_position{‘first’, ‘last’},默認 ‘last’

首先將NaNs放在開頭,最後將NaNs放在末尾。未實現多索引。

返回

sorted_objDataFrame

例子

>>> df = ps.DataFrame({'A': [2, 1, np.nan]}, index=['b', 'a', np.nan])
>>> df.sort_index()
       A
a    1.0
b    2.0
NaN  NaN
>>> df.sort_index(ascending=False)
       A
b    2.0
a    1.0
NaN  NaN
>>> df.sort_index(na_position='first')
       A
NaN  NaN
a    1.0
b    2.0
>>> df.sort_index(inplace=True)
>>> df
       A
a    1.0
b    2.0
NaN  NaN
>>> df = ps.DataFrame({'A': range(4), 'B': range(4)[::-1]},
...                   index=[['b', 'b', 'a', 'a'], [1, 0, 1, 0]],
...                   columns=['A', 'B'])
>>> df.sort_index()
     A  B
a 0  3  0
  1  2  1
b 0  1  2
  1  0  3
>>> df.sort_index(level=1)  
     A  B
a 0  3  0
b 0  1  2
a 1  2  1
b 1  0  3
>>> df.sort_index(level=[1, 0])
     A  B
a 0  3  0
b 0  1  2
a 1  2  1
b 1  0  3

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.sort_index。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。