Python pandas.Index.duplicated用法及代码示例

用法: Index.duplicated(keep='first')

指示重复的索引值。

重复值在结果数组中表示为 True 值。可以指示所有重复，除了第一个之外的所有重复，或者除了最后一次出现的重复之外的所有重复。

keep：{‘first’, ‘last’, False}，默认 ‘first’

一组重复项中要标记为缺失的值。

默认情况下，对于每组重复值，第一次出现设置为 False，其他所有设置为 True：

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> idx.duplicated()
array([False, False,  True, False,  True])

这相当于

>>> idx.duplicated(keep='first')
array([False, False,  True, False,  True])

通过使用‘last’，每组重复值的最后一次出现设置为 False，所有其他值设置为 True：

>>> idx.duplicated(keep='last')
array([ True, False,  True, False, False])

通过设置 keep on False ，所有重复项都是 True：

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])

相关用法

注：本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.Index.duplicated。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。