Python pandas.Index.duplicated用法及代碼示例

用法: Index.duplicated(keep='first')

指示重複的索引值。

重複值在結果數組中表示為 True 值。可以指示所有重複，除了第一個之外的所有重複，或者除了最後一次出現的重複之外的所有重複。

keep：{‘first’, ‘last’, False}，默認 ‘first’

一組重複項中要標記為缺失的值。

默認情況下，對於每組重複值，第一次出現設置為 False，其他所有設置為 True：

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> idx.duplicated()
array([False, False,  True, False,  True])

這相當於

>>> idx.duplicated(keep='first')
array([False, False,  True, False,  True])

通過使用‘last’，每組重複值的最後一次出現設置為 False，所有其他值設置為 True：

>>> idx.duplicated(keep='last')
array([ True, False,  True, False, False])

通過設置 keep on False ，所有重複項都是 True：

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])

相關用法

注：本文由純淨天空篩選整理自pandas.pydata.org大神的英文原創作品 pandas.Index.duplicated。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。