當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark Series.unstack用法及代碼示例

本文簡要介紹 pyspark.pandas.Series.unstack 的用法。

用法:

Series.unstack(level: int = - 1) → pyspark.pandas.frame.DataFrame

Unstack,又名樞軸,帶有 MultiIndex 的係列以生成 DataFrame。涉及的級別將自動排序。

參數

levelint、str 或這些列表,默認最後一級

要取消堆疊的關卡,可以傳遞關卡名稱。

返回

DataFrame

未堆疊係列。

注意

與 pandas 不同,pandas-on-Spark 不檢查索引是否重複,因為檢查重複索引需要掃描整個數據,這可能非常昂貴。

例子

>>> s = ps.Series([1, 2, 3, 4],
...               index=pd.MultiIndex.from_product([['one', 'two'],
...                                                 ['a', 'b']]))
>>> s
one  a    1
     b    2
two  a    3
     b    4
dtype: int64
>>> s.unstack(level=-1).sort_index()
     a  b
one  1  2
two  3  4
>>> s.unstack(level=0).sort_index()
   one  two
a    1    3
b    2    4

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.unstack。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。