用法:
Series.duplicated(keep='first')
指示重复的系列值。
重复值在生成的系列中表示为
True
值。可以指示所有重复项,除了第一个重复项之外的所有重复项,或者除了最后一个重复项之外的所有重复项。- keep:{‘first’, ‘last’, False},默认 ‘first’
处理删除重复项的方法:
‘first’:将重复项标记为
True
,但第一次出现除外。‘last’:将重复项标记为
True
,最后一次出现除外。False
:将所有重复项标记为True
。
- Series[bool]
系列指示每个值是否已出现在前面的值中。
参数:
返回:
例子:
默认情况下,对于每组重复值,第一次出现设置为 False,其他所有设置为 True:
>>> animals = pd.Series(['lama', 'cow', 'lama', 'beetle', 'lama']) >>> animals.duplicated() 0 False 1 False 2 True 3 False 4 True dtype:bool
这相当于
>>> animals.duplicated(keep='first') 0 False 1 False 2 True 3 False 4 True dtype:bool
通过使用‘last’,每组重复值的最后一次出现设置为 False,所有其他值设置为 True:
>>> animals.duplicated(keep='last') 0 True 1 False 2 True 3 False 4 False dtype:bool
通过设置 keep on
False
,所有重复项都是 True:>>> animals.duplicated(keep=False) 0 True 1 False 2 True 3 False 4 True dtype:bool
相关用法
- Python pandas.Series.dt.day_name用法及代码示例
- Python pandas.Series.dt.is_year_end用法及代码示例
- Python pandas.Series.divide用法及代码示例
- Python pandas.Series.dt.weekday用法及代码示例
- Python pandas.Series.div用法及代码示例
- Python pandas.Series.dt.to_pydatetime用法及代码示例
- Python pandas.Series.dt.second用法及代码示例
- Python pandas.Series.dt.tz_localize用法及代码示例
- Python pandas.Series.dt.is_leap_year用法及代码示例
- Python pandas.Series.divmod用法及代码示例
- Python pandas.Series.dt.is_quarter_start用法及代码示例
- Python pandas.Series.dot用法及代码示例
- Python pandas.Series.drop用法及代码示例
- Python pandas.Series.dt.tz_convert用法及代码示例
- Python pandas.Series.dt.round用法及代码示例
- Python pandas.Series.dt.nanosecond用法及代码示例
- Python pandas.Series.dt.to_period用法及代码示例
- Python pandas.Series.dt.ceil用法及代码示例
- Python pandas.Series.dt.hour用法及代码示例
- Python pandas.Series.dt.day用法及代码示例
注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.Series.duplicated。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。