Python pyspark DataFrame.xs用法及代碼示例

本文簡要介紹 pyspark.pandas.DataFrame.xs 的用法。

用法: DataFrame.xs(key: Union[Any, Tuple[Any, …]], axis: Union[int, str] = 0, level: Optional[int] = None) → Union[DataFrame, Series]

從 DataFrame 返回橫截麵。

此方法采用 key 參數來選擇 MultiIndex 特定級別的數據。

參數：

key：標簽或標簽元組: 標簽包含在索引中，或部分包含在 MultiIndex 中。
axis：0 或‘index’，默認為 0: 檢索橫截麵的軸。目前隻支持0或‘index’
level：對象，默認為前 n 級(n=1 或 len(key)): 如果鍵部分包含在 MultiIndex 中，請指明使用了哪些級別。級別可以通過標簽或位置來引用。

DataFrame 或係列: 與所選索引級別相對應的原始 DataFrame 的橫截麵。

例子：

>>> d = {'num_legs': [4, 4, 2, 2],
...      'num_wings': [0, 0, 2, 2],
...      'class': ['mammal', 'mammal', 'mammal', 'bird'],
...      'animal': ['cat', 'dog', 'bat', 'penguin'],
...      'locomotion': ['walks', 'walks', 'flies', 'walks']}
>>> df = ps.DataFrame(data=d)
>>> df = df.set_index(['class', 'animal', 'locomotion'])
>>> df  
                           num_legs  num_wings
class  animal  locomotion
mammal cat     walks              4          0
       dog     walks              4          0
       bat     flies              2          2
bird   penguin walks              2          2

獲取指定索引處的值

>>> df.xs('mammal')  
                   num_legs  num_wings
animal locomotion
cat    walks              4          0
dog    walks              4          0
bat    flies              2          2

獲取多個索引處的值

>>> df.xs(('mammal', 'dog'))  
            num_legs  num_wings
locomotion
walks              4          0

>>> df.xs(('mammal', 'dog', 'walks'))  
num_legs     4
num_wings    0
Name: (mammal, dog, walks), dtype: int64

獲取指定索引和級別的值

>>> df.xs('cat', level=1)  
                   num_legs  num_wings
class  locomotion
mammal walks              4          0

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.xs。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

例子：