当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas DataFrame duplicated方法用法及代码示例


Pandas DataFrame.duplicated(~) 方法返回一系列布尔值,其中 True 表示重复行。

参数

1.subset | stringarray-likestring | optional

要考虑的列的标签。默认情况下,会考虑所有列。

2. keep | booleanstring | optional

重复的标记规则:

说明

"first"

除了第一个之外,所有重复项都标记为 True

"last"

除了最后一个之外,所有重复项都标记为True

False

所有重复项都标记为 True

默认情况下,keep="first"

返回值

Series,其中 True 表示重复行。

例子

考虑以下 DataFrame :

df = pd.DataFrame({"A":[1,2,1], "B":[3,4,3]})
df



   A  B
0  1  3
1  2  4
2  1  3

这里,第一行和第三行是重复的。

指定保持参数

第一的

要标记除第一行之外的所有重复行:

df.duplicated()   # or explicitly set keep="first"



0    False
1    False
2     True
dtype: bool
最后的

要标记除最后一行之外的所有重复行:

df.duplicated(keep="last")



0     True
1    False
2    False
dtype: bool
False

要将所有重复行标记为 True

df.duplicated(keep=False)



0    True
1    False
2    True
dtype: bool

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 Pandas DataFrame | duplicated method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。