Python pandas.Series.duplicated用法及代碼示例

用法: Series.duplicated(keep='first')

指示重複的係列值。

重複值在生成的係列中表示為 True 值。可以指示所有重複項，除了第一個重複項之外的所有重複項，或者除了最後一個重複項之外的所有重複項。

參數：

keep：{‘first’, ‘last’, False}，默認 ‘first’

處理刪除重複項的方法：

‘first’：將重複項標記為True，但第一次出現除外。
‘last’：將重複項標記為True，最後一次出現除外。
False ：將所有重複項標記為 True 。

Series[bool]: 係列指示每個值是否已出現在前麵的值中。

例子：

默認情況下，對於每組重複值，第一次出現設置為 False，其他所有設置為 True：

>>> animals = pd.Series(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> animals.duplicated()
0    False
1    False
2     True
3    False
4     True
dtype:bool

這相當於

>>> animals.duplicated(keep='first')
0    False
1    False
2     True
3    False
4     True
dtype:bool

通過使用‘last’，每組重複值的最後一次出現設置為 False，所有其他值設置為 True：

>>> animals.duplicated(keep='last')
0     True
1    False
2     True
3    False
4    False
dtype:bool

通過設置 keep on False ，所有重複項都是 True：

>>> animals.duplicated(keep=False)
0     True
1    False
2     True
3    False
4     True
dtype:bool

相關用法

注：本文由純淨天空篩選整理自pandas.pydata.org大神的英文原創作品 pandas.Series.duplicated。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

例子：