Python cudf.Series.drop_duplicates用法及代码示例

用法: Series.drop_duplicates(keep='first', inplace=False, ignore_index=False)

返回删除重复值的系列。

参数：

keep：{‘first’, ‘last’, False }，默认 ‘first’

处理删除重复项的方法：

‘first’：删除除第一次出现的重复项。
‘last’：删除除最后一次之外的重复项。
False ：删除所有重复项。

inplace：布尔值，默认 False

如果 True ，就地执行操作并返回 None。

系列或无: 如果 inplace=True ，则删除重复的系列或 None 。

例子：

>>> s = cudf.Series(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'],
...               name='animal')
>>> s
0      lama
1       cow
2      lama
3    beetle
4      lama
5     hippo
Name: animal, dtype: object

使用keep 参数，可以更改重复值的选择行为。值‘first’ 保留每组重复条目的第一次出现。保持的默认值为‘first’。请注意，返回的行的顺序不能保证是排序的。

>>> s.drop_duplicates()
3    beetle
1       cow
5     hippo
0      lama
Name: animal, dtype: object

参数keep 的值‘last’ 保留每组重复条目的最后一次出现。

>>> s.drop_duplicates(keep='last')
3    beetle
1       cow
5     hippo
4      lama
Name: animal, dtype: object

参数keep 的值False 丢弃所有重复条目集。将 ‘inplace’ 的值设置为 True 会就地执行操作并返回 None 。

>>> s.drop_duplicates(keep=False, inplace=True)
>>> s
3    beetle
1       cow
5     hippo
Name: animal, dtype: object

相关用法

注：本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.Series.drop_duplicates。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

例子：