当前位置: 首页>>编程示例 >>用法及示例精选 >>正文


Python pandas.Series.duplicated用法及代码示例

用法:

Series.duplicated(keep='first')

指示重复的系列值。

重复值在生成的系列中表示为 True 值。可以指示所有重复项,除了第一个重复项之外的所有重复项,或者除了最后一个重复项之外的所有重复项。

参数

keep{‘first’, ‘last’, False},默认 ‘first’

处理删除重复项的方法:

  • ‘first’:将重复项标记为True,但第一次出现除外。

  • ‘last’:将重复项标记为True,最后一次出现除外。

  • False :将所有重复项标记为 True

返回

Series[bool]

系列指示每个值是否已出现在前面的值中。

例子

默认情况下,对于每组重复值,第一次出现设置为 False,其他所有设置为 True:

>>> animals = pd.Series(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> animals.duplicated()
0    False
1    False
2     True
3    False
4     True
dtype:bool

这相当于

>>> animals.duplicated(keep='first')
0    False
1    False
2     True
3    False
4     True
dtype:bool

通过使用‘last’,每组重复值的最后一次出现设置为 False,所有其他值设置为 True:

>>> animals.duplicated(keep='last')
0     True
1    False
2     True
3    False
4    False
dtype:bool

通过设置 keep on False ,所有重复项都是 True:

>>> animals.duplicated(keep=False)
0     True
1    False
2     True
3    False
4     True
dtype:bool

相关用法


注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.Series.duplicated。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。