Python pyspark Series.unstack用法及代码示例

本文简要介绍 pyspark.pandas.Series.unstack 的用法。

用法: Series.unstack(level: int = - 1) → pyspark.pandas.frame.DataFrame

Unstack，又名枢轴，带有 MultiIndex 的系列以生成 DataFrame。涉及的级别将自动排序。

参数：

level：int、str 或这些列表，默认最后一级: 要取消堆叠的关卡，可以传递关卡名称。

DataFrame: 未堆叠系列。

注意：

与 pandas 不同，pandas-on-Spark 不检查索引是否重复，因为检查重复索引需要扫描整个数据，这可能非常昂贵。

例子：

>>> s = ps.Series([1, 2, 3, 4],
...               index=pd.MultiIndex.from_product([['one', 'two'],
...                                                 ['a', 'b']]))
>>> s
one  a    1
     b    2
two  a    3
     b    4
dtype: int64

>>> s.unstack(level=-1).sort_index()
     a  b
one  1  2
two  3  4

>>> s.unstack(level=0).sort_index()
   one  two
a    1    3
b    2    4

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.unstack。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

注意：

例子：