当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pandas.Index.duplicated用法及代码示例


用法:

Index.duplicated(keep='first')

指示重复的索引值。

重复值在结果数组中表示为 True 值。可以指示所有重复,除了第一个之外的所有重复,或者除了最后一次出现的重复之外的所有重复。

参数

keep{‘first’, ‘last’, False},默认 ‘first’

一组重复项中要标记为缺失的值。

  • ‘first’:将重复项标记为True,但第一次出现除外。

  • ‘last’:将重复项标记为True,最后一次出现除外。

  • False :将所有重复项标记为 True

返回

np.ndarray[bool]

例子

默认情况下,对于每组重复值,第一次出现设置为 False,其他所有设置为 True:

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> idx.duplicated()
array([False, False,  True, False,  True])

这相当于

>>> idx.duplicated(keep='first')
array([False, False,  True, False,  True])

通过使用‘last’,每组重复值的最后一次出现设置为 False,所有其他值设置为 True:

>>> idx.duplicated(keep='last')
array([ True, False,  True, False, False])

通过设置 keep on False ,所有重复项都是 True:

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])

相关用法


注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.Index.duplicated。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。