当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.sort_index用法及代码示例


本文简要介绍 pyspark.pandas.DataFrame.sort_index 的用法。

用法:

DataFrame.sort_index(axis: Union[int, str] = 0, level: Union[int, List[int], None] = None, ascending: bool = True, inplace: bool = False, kind: str = None, na_position: str = 'last') → Optional[pyspark.pandas.frame.DataFrame]

按标签排序对象(沿轴)

参数

axis索引,列直接排序。目前,仅支持axis = 0。
levelint 或级别名称或整数列表或级别名称列表

如果不是无,则对指定索引级别的值进行排序

ascending布尔值,默认 True

升序与降序排序

inplace布尔值,默认为 False

如果为真,就地执行操作

kindstr,默认无

pandas-on-Spark目前不允许指定排序算法,默认无

na_position{‘first’, ‘last’},默认 ‘last’

首先将NaNs放在开头,最后将NaNs放在末尾。未实现多索引。

返回

sorted_objDataFrame

例子

>>> df = ps.DataFrame({'A': [2, 1, np.nan]}, index=['b', 'a', np.nan])
>>> df.sort_index()
       A
a    1.0
b    2.0
NaN  NaN
>>> df.sort_index(ascending=False)
       A
b    2.0
a    1.0
NaN  NaN
>>> df.sort_index(na_position='first')
       A
NaN  NaN
a    1.0
b    2.0
>>> df.sort_index(inplace=True)
>>> df
       A
a    1.0
b    2.0
NaN  NaN
>>> df = ps.DataFrame({'A': range(4), 'B': range(4)[::-1]},
...                   index=[['b', 'b', 'a', 'a'], [1, 0, 1, 0]],
...                   columns=['A', 'B'])
>>> df.sort_index()
     A  B
a 0  3  0
  1  2  1
b 0  1  2
  1  0  3
>>> df.sort_index(level=1)  
     A  B
a 0  3  0
b 0  1  2
a 1  2  1
b 1  0  3
>>> df.sort_index(level=[1, 0])
     A  B
a 0  3  0
b 0  1  2
a 1  2  1
b 1  0  3

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.sort_index。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。