当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.isin用法及代码示例


本文简要介绍 pyspark.pandas.DataFrame.isin 的用法。

用法:

DataFrame.isin(values: Union[List, Dict]) → pyspark.pandas.frame.DataFrame

DataFrame中的每个元素是否包含在值中。

参数

values可迭代或 dict

要测试的值的序列。如果 value 是字典,则键必须是列名,并且必须匹配。不支持系列和DataFrame。

返回

DataFrame

DataFrame 布尔值,显示 DataFrame 中的每个元素是否包含在值中。

例子

>>> df = ps.DataFrame({'num_legs': [2, 4], 'num_wings': [2, 0]},
...                   index=['falcon', 'dog'],
...                   columns=['num_legs', 'num_wings'])
>>> df
        num_legs  num_wings
falcon         2          2
dog            4          0

values 是列表时,检查 DataFrame 中的每个值是否都出现在列表中(哪些动物有 0 或 2 条腿或翅膀)

>>> df.isin([0, 2])
        num_legs  num_wings
falcon      True       True
dog        False       True

values 是一个字典时,我们可以传递值来分别检查每一列:

>>> df.isin({'num_wings': [0, 3]})
        num_legs  num_wings
falcon     False      False
dog        False       True

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.isin。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。