当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark MultiIndex.to_frame用法及代码示例


本文简要介绍 pyspark.pandas.MultiIndex.to_frame 的用法。

用法:

MultiIndex.to_frame(index: bool = True, name: Optional[List[Union[Any, Tuple[Any, …]]]] = None) → pyspark.pandas.frame.DataFrame

创建一个 DataFrame,其中 MultiIndex 的级别作为列。列顺序由 DataFrame 构造函数确定,数据为字典。

参数

index布尔值,默认 True

将返回的DataFrame的索引设置为原始MultiIndex。

name字符串列表/序列,可选

传递的名称应该替换索引级别的名称。

返回

DataFrame包含原始 MultiIndex 数据的 DataFrame。

例子

>>> tuples = [(1, 'red'), (1, 'blue'),
...           (2, 'red'), (2, 'blue')]
>>> idx = ps.MultiIndex.from_tuples(tuples, names=('number', 'color'))
>>> idx  
MultiIndex([(1,  'red'),
            (1, 'blue'),
            (2,  'red'),
            (2, 'blue')],
           names=['number', 'color'])
>>> idx.to_frame()  
              number color
number color
1      red         1   red
       blue        1  blue
2      red         2   red
       blue        2  blue

默认情况下,原始索引被重用。要强制执行新索引:

>>> idx.to_frame(index=False)
   number color
0       1   red
1       1  blue
2       2   red
3       2  blue

要覆盖结果列的名称,请指定 name

>>> idx.to_frame(name=['n', 'c'])  
              n     c
number color
1      red    1   red
       blue   1  blue
2      red    2   red
       blue   2  blue

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.MultiIndex.to_frame。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。