当前位置: 首页>>编程示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.xs用法及代码示例

本文简要介绍 pyspark.pandas.DataFrame.xs 的用法。

用法:

DataFrame.xs(key: Union[Any, Tuple[Any, …]], axis: Union[int, str] = 0, level: Optional[int] = None) → Union[DataFrame, Series]

从 DataFrame 返回横截面。

此方法采用 key 参数来选择 MultiIndex 特定级别的数据。

参数

key标签或标签元组

标签包含在索引中,或部分包含在 MultiIndex 中。

axis0 或‘index’,默认为 0

检索横截面的轴。目前只支持0或‘index’

level对象,默认为前 n 级(n=1 或 len(key))

如果键部分包含在 MultiIndex 中,请指明使用了哪些级别。级别可以通过标签或位置来引用。

返回

DataFrame 或系列

与所选索引级别相对应的原始 DataFrame 的横截面。

例子

>>> d = {'num_legs': [4, 4, 2, 2],
...      'num_wings': [0, 0, 2, 2],
...      'class': ['mammal', 'mammal', 'mammal', 'bird'],
...      'animal': ['cat', 'dog', 'bat', 'penguin'],
...      'locomotion': ['walks', 'walks', 'flies', 'walks']}
>>> df = ps.DataFrame(data=d)
>>> df = df.set_index(['class', 'animal', 'locomotion'])
>>> df  
                           num_legs  num_wings
class  animal  locomotion
mammal cat     walks              4          0
       dog     walks              4          0
       bat     flies              2          2
bird   penguin walks              2          2

获取指定索引处的值

>>> df.xs('mammal')  
                   num_legs  num_wings
animal locomotion
cat    walks              4          0
dog    walks              4          0
bat    flies              2          2

获取多个索引处的值

>>> df.xs(('mammal', 'dog'))  
            num_legs  num_wings
locomotion
walks              4          0
>>> df.xs(('mammal', 'dog', 'walks'))  
num_legs     4
num_wings    0
Name: (mammal, dog, walks), dtype: int64

获取指定索引和级别的值

>>> df.xs('cat', level=1)  
                   num_legs  num_wings
class  locomotion
mammal walks              4          0

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.xs。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。