Python pyspark DataFrame.xs用法及代码示例

本文简要介绍 pyspark.pandas.DataFrame.xs 的用法。

用法: DataFrame.xs(key: Union[Any, Tuple[Any, …]], axis: Union[int, str] = 0, level: Optional[int] = None) → Union[DataFrame, Series]

从 DataFrame 返回横截面。

此方法采用 key 参数来选择 MultiIndex 特定级别的数据。

参数：

key：标签或标签元组: 标签包含在索引中，或部分包含在 MultiIndex 中。
axis：0 或‘index’，默认为 0: 检索横截面的轴。目前只支持0或‘index’
level：对象，默认为前 n 级(n=1 或 len(key)): 如果键部分包含在 MultiIndex 中，请指明使用了哪些级别。级别可以通过标签或位置来引用。

DataFrame 或系列: 与所选索引级别相对应的原始 DataFrame 的横截面。

例子：

>>> d = {'num_legs': [4, 4, 2, 2],
...      'num_wings': [0, 0, 2, 2],
...      'class': ['mammal', 'mammal', 'mammal', 'bird'],
...      'animal': ['cat', 'dog', 'bat', 'penguin'],
...      'locomotion': ['walks', 'walks', 'flies', 'walks']}
>>> df = ps.DataFrame(data=d)
>>> df = df.set_index(['class', 'animal', 'locomotion'])
>>> df  
                           num_legs  num_wings
class  animal  locomotion
mammal cat     walks              4          0
       dog     walks              4          0
       bat     flies              2          2
bird   penguin walks              2          2

获取指定索引处的值

>>> df.xs('mammal')  
                   num_legs  num_wings
animal locomotion
cat    walks              4          0
dog    walks              4          0
bat    flies              2          2

获取多个索引处的值

>>> df.xs(('mammal', 'dog'))  
            num_legs  num_wings
locomotion
walks              4          0

>>> df.xs(('mammal', 'dog', 'walks'))  
num_legs     4
num_wings    0
Name: (mammal, dog, walks), dtype: int64

获取指定索引和级别的值

>>> df.xs('cat', level=1)  
                   num_legs  num_wings
class  locomotion
mammal walks              4          0

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.xs。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

例子：