Python pyspark MultiIndex.to_frame用法及代码示例

本文简要介绍 pyspark.pandas.MultiIndex.to_frame 的用法。

用法: MultiIndex.to_frame(index: bool = True, name: Optional[List[Union[Any, Tuple[Any, …]]]] = None) → pyspark.pandas.frame.DataFrame

创建一个 DataFrame，其中 MultiIndex 的级别作为列。列顺序由 DataFrame 构造函数确定，数据为字典。

参数：

index：布尔值，默认 True: 将返回的DataFrame的索引设置为原始MultiIndex。
name：字符串列表/序列，可选: 传递的名称应该替换索引级别的名称。

DataFrame：包含原始 MultiIndex 数据的 DataFrame。

例子：

>>> tuples = [(1, 'red'), (1, 'blue'),
...           (2, 'red'), (2, 'blue')]
>>> idx = ps.MultiIndex.from_tuples(tuples, names=('number', 'color'))
>>> idx  
MultiIndex([(1,  'red'),
            (1, 'blue'),
            (2,  'red'),
            (2, 'blue')],
           names=['number', 'color'])
>>> idx.to_frame()  
              number color
number color
1      red         1   red
       blue        1  blue
2      red         2   red
       blue        2  blue

默认情况下，原始索引被重用。要强制执行新索引：

>>> idx.to_frame(index=False)
   number color
0       1   red
1       1  blue
2       2   red
3       2  blue

要覆盖结果列的名称，请指定 name ：

>>> idx.to_frame(name=['n', 'c'])  
              n     c
number color
1      red    1   red
       blue   1  blue
2      red    2   red
       blue   2  blue

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.MultiIndex.to_frame。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

例子：