当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.unstack用法及代码示例


本文简要介绍 pyspark.pandas.Series.unstack 的用法。

用法:

Series.unstack(level: int = - 1) → pyspark.pandas.frame.DataFrame

Unstack,又名枢轴,带有 MultiIndex 的系列以生成 DataFrame。涉及的级别将自动排序。

参数

levelint、str 或这些列表,默认最后一级

要取消堆叠的关卡,可以传递关卡名称。

返回

DataFrame

未堆叠系列。

注意

与 pandas 不同,pandas-on-Spark 不检查索引是否重复,因为检查重复索引需要扫描整个数据,这可能非常昂贵。

例子

>>> s = ps.Series([1, 2, 3, 4],
...               index=pd.MultiIndex.from_product([['one', 'two'],
...                                                 ['a', 'b']]))
>>> s
one  a    1
     b    2
two  a    3
     b    4
dtype: int64
>>> s.unstack(level=-1).sort_index()
     a  b
one  1  2
two  3  4
>>> s.unstack(level=0).sort_index()
   one  two
a    1    3
b    2    4

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.unstack。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。