當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark MultiIndex.to_frame用法及代碼示例


本文簡要介紹 pyspark.pandas.MultiIndex.to_frame 的用法。

用法:

MultiIndex.to_frame(index: bool = True, name: Optional[List[Union[Any, Tuple[Any, …]]]] = None) → pyspark.pandas.frame.DataFrame

創建一個 DataFrame,其中 MultiIndex 的級別作為列。列順序由 DataFrame 構造函數確定,數據為字典。

參數

index布爾值,默認 True

將返回的DataFrame的索引設置為原始MultiIndex。

name字符串列表/序列,可選

傳遞的名稱應該替換索引級別的名稱。

返回

DataFrame包含原始 MultiIndex 數據的 DataFrame。

例子

>>> tuples = [(1, 'red'), (1, 'blue'),
...           (2, 'red'), (2, 'blue')]
>>> idx = ps.MultiIndex.from_tuples(tuples, names=('number', 'color'))
>>> idx  
MultiIndex([(1,  'red'),
            (1, 'blue'),
            (2,  'red'),
            (2, 'blue')],
           names=['number', 'color'])
>>> idx.to_frame()  
              number color
number color
1      red         1   red
       blue        1  blue
2      red         2   red
       blue        2  blue

默認情況下,原始索引被重用。要強製執行新索引:

>>> idx.to_frame(index=False)
   number color
0       1   red
1       1  blue
2       2   red
3       2  blue

要覆蓋結果列的名稱,請指定 name

>>> idx.to_frame(name=['n', 'c'])  
              n     c
number color
1      red    1   red
       blue   1  blue
2      red    2   red
       blue   2  blue

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.MultiIndex.to_frame。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。