当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark MultiIndex用法及代码示例


本文简要介绍 pyspark.pandas.MultiIndex 的用法。

用法:

class pyspark.pandas.MultiIndex

pandas-on-Spark MultiIndex 逻辑上对应 pandas MultiIndex。这可能会在内部保留 Spark Column。

参数

levels数组序列

每个级别的唯一标签。

codes数组序列

每个级别的整数,指定每个位置的标签。

sortorder可选int

排序级别(必须按该级别按字典顺序排序)。

names可选的对象序列

每个索引级别的名称。 (名称被接受为兼容)。

copy布尔值,默认为 False

复制meta-data。

verify_integrity布尔值,默认为真

检查级别/代码是否一致且有效。

例子

>>> ps.DataFrame({'a': ['a', 'b', 'c']}, index=[[1, 2, 3], [4, 5, 6]]).index  
MultiIndex([(1, 4),
            (2, 5),
            (3, 6)],
           )
>>> ps.DataFrame({'a': [1, 2, 3]}, index=[list('abc'), list('def')]).index  
MultiIndex([('a', 'd'),
            ('b', 'e'),
            ('c', 'f')],
           )

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.MultiIndex。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。