當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.isin用法及代碼示例


本文簡要介紹 pyspark.pandas.DataFrame.isin 的用法。

用法:

DataFrame.isin(values: Union[List, Dict]) → pyspark.pandas.frame.DataFrame

DataFrame中的每個元素是否包含在值中。

參數

values可迭代或 dict

要測試的值的序列。如果 value 是字典,則鍵必須是列名,並且必須匹配。不支持係列和DataFrame。

返回

DataFrame

DataFrame 布爾值,顯示 DataFrame 中的每個元素是否包含在值中。

例子

>>> df = ps.DataFrame({'num_legs': [2, 4], 'num_wings': [2, 0]},
...                   index=['falcon', 'dog'],
...                   columns=['num_legs', 'num_wings'])
>>> df
        num_legs  num_wings
falcon         2          2
dog            4          0

values 是列表時,檢查 DataFrame 中的每個值是否都出現在列表中(哪些動物有 0 或 2 條腿或翅膀)

>>> df.isin([0, 2])
        num_legs  num_wings
falcon      True       True
dog        False       True

values 是一個字典時,我們可以傳遞值來分別檢查每一列:

>>> df.isin({'num_wings': [0, 3]})
        num_legs  num_wings
falcon     False      False
dog        False       True

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.isin。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。