當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pandas.Series.duplicated用法及代碼示例

用法:

Series.duplicated(keep='first')

指示重複的係列值。

重複值在生成的係列中表示為 True 值。可以指示所有重複項,除了第一個重複項之外的所有重複項,或者除了最後一個重複項之外的所有重複項。

參數

keep{‘first’, ‘last’, False},默認 ‘first’

處理刪除重複項的方法:

  • ‘first’:將重複項標記為True,但第一次出現除外。

  • ‘last’:將重複項標記為True,最後一次出現除外。

  • False :將所有重複項標記為 True

返回

Series[bool]

係列指示每個值是否已出現在前麵的值中。

例子

默認情況下,對於每組重複值,第一次出現設置為 False,其他所有設置為 True:

>>> animals = pd.Series(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> animals.duplicated()
0    False
1    False
2     True
3    False
4     True
dtype:bool

這相當於

>>> animals.duplicated(keep='first')
0    False
1    False
2     True
3    False
4     True
dtype:bool

通過使用‘last’,每組重複值的最後一次出現設置為 False,所有其他值設置為 True:

>>> animals.duplicated(keep='last')
0     True
1    False
2     True
3    False
4    False
dtype:bool

通過設置 keep on False ,所有重複項都是 True:

>>> animals.duplicated(keep=False)
0     True
1    False
2     True
3    False
4     True
dtype:bool

相關用法


注:本文由純淨天空篩選整理自pandas.pydata.org大神的英文原創作品 pandas.Series.duplicated。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。