當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pandas.Index.duplicated用法及代碼示例


用法:

Index.duplicated(keep='first')

指示重複的索引值。

重複值在結果數組中表示為 True 值。可以指示所有重複,除了第一個之外的所有重複,或者除了最後一次出現的重複之外的所有重複。

參數

keep{‘first’, ‘last’, False},默認 ‘first’

一組重複項中要標記為缺失的值。

  • ‘first’:將重複項標記為True,但第一次出現除外。

  • ‘last’:將重複項標記為True,最後一次出現除外。

  • False :將所有重複項標記為 True

返回

np.ndarray[bool]

例子

默認情況下,對於每組重複值,第一次出現設置為 False,其他所有設置為 True:

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> idx.duplicated()
array([False, False,  True, False,  True])

這相當於

>>> idx.duplicated(keep='first')
array([False, False,  True, False,  True])

通過使用‘last’,每組重複值的最後一次出現設置為 False,所有其他值設置為 True:

>>> idx.duplicated(keep='last')
array([ True, False,  True, False, False])

通過設置 keep on False ,所有重複項都是 True:

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])

相關用法


注:本文由純淨天空篩選整理自pandas.pydata.org大神的英文原創作品 pandas.Index.duplicated。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。