Python pyspark Series.unstack用法及代碼示例

本文簡要介紹 pyspark.pandas.Series.unstack 的用法。

用法: Series.unstack(level: int = - 1) → pyspark.pandas.frame.DataFrame

Unstack，又名樞軸，帶有 MultiIndex 的係列以生成 DataFrame。涉及的級別將自動排序。

參數：

level：int、str 或這些列表，默認最後一級: 要取消堆疊的關卡，可以傳遞關卡名稱。

DataFrame: 未堆疊係列。

注意：

與 pandas 不同，pandas-on-Spark 不檢查索引是否重複，因為檢查重複索引需要掃描整個數據，這可能非常昂貴。

例子：

>>> s = ps.Series([1, 2, 3, 4],
...               index=pd.MultiIndex.from_product([['one', 'two'],
...                                                 ['a', 'b']]))
>>> s
one  a    1
     b    2
two  a    3
     b    4
dtype: int64

>>> s.unstack(level=-1).sort_index()
     a  b
one  1  2
two  3  4

>>> s.unstack(level=0).sort_index()
   one  two
a    1    3
b    2    4

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.unstack。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

注意：

例子：