當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark MultiIndex.from_frame用法及代碼示例

本文簡要介紹 pyspark.pandas.MultiIndex.from_frame 的用法。

用法:

static MultiIndex.from_frame(df: pyspark.pandas.frame.DataFrame, names: Optional[List[Union[Any, Tuple[Any, …]]]] = None) → pyspark.pandas.indexes.multi.MultiIndex

從 DataFrame 中創建 MultiIndex。

參數

dfDataFrame

DataFrame 轉換為多索引。

names類似列表,可選

如果沒有提供名稱,則使用列名,如果列是 MultiIndex,則使用列名的元組。如果是序列,則用給定的序列覆蓋名稱。

返回

MultiIndex

給定 DataFrame 的 MultiIndex 表示形式。

例子

>>> df = ps.DataFrame([['HI', 'Temp'], ['HI', 'Precip'],
...                    ['NJ', 'Temp'], ['NJ', 'Precip']],
...                   columns=['a', 'b'])
>>> df  
      a       b
0    HI    Temp
1    HI  Precip
2    NJ    Temp
3    NJ  Precip
>>> ps.MultiIndex.from_frame(df)  
MultiIndex([('HI',   'Temp'),
            ('HI', 'Precip'),
            ('NJ',   'Temp'),
            ('NJ', 'Precip')],
           names=['a', 'b'])

使用顯式名稱,而不是列名

>>> ps.MultiIndex.from_frame(df, names=['state', 'observation'])  
MultiIndex([('HI',   'Temp'),
            ('HI', 'Precip'),
            ('NJ',   'Temp'),
            ('NJ', 'Precip')],
           names=['state', 'observation'])

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.MultiIndex.from_frame。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。