当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark MultiIndex.from_frame用法及代码示例


本文简要介绍 pyspark.pandas.MultiIndex.from_frame 的用法。

用法:

static MultiIndex.from_frame(df: pyspark.pandas.frame.DataFrame, names: Optional[List[Union[Any, Tuple[Any, …]]]] = None) → pyspark.pandas.indexes.multi.MultiIndex

从 DataFrame 中创建 MultiIndex。

参数

dfDataFrame

DataFrame 转换为多索引。

names类似列表,可选

如果没有提供名称,则使用列名,如果列是 MultiIndex,则使用列名的元组。如果是序列,则用给定的序列覆盖名称。

返回

MultiIndex

给定 DataFrame 的 MultiIndex 表示形式。

例子

>>> df = ps.DataFrame([['HI', 'Temp'], ['HI', 'Precip'],
...                    ['NJ', 'Temp'], ['NJ', 'Precip']],
...                   columns=['a', 'b'])
>>> df  
      a       b
0    HI    Temp
1    HI  Precip
2    NJ    Temp
3    NJ  Precip
>>> ps.MultiIndex.from_frame(df)  
MultiIndex([('HI',   'Temp'),
            ('HI', 'Precip'),
            ('NJ',   'Temp'),
            ('NJ', 'Precip')],
           names=['a', 'b'])

使用显式名称,而不是列名

>>> ps.MultiIndex.from_frame(df, names=['state', 'observation'])  
MultiIndex([('HI',   'Temp'),
            ('HI', 'Precip'),
            ('NJ',   'Temp'),
            ('NJ', 'Precip')],
           names=['state', 'observation'])

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.MultiIndex.from_frame。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。