Python cudf.Series.drop_duplicates用法及代碼示例

用法: Series.drop_duplicates(keep='first', inplace=False, ignore_index=False)

返回刪除重複值的係列。

參數：

keep：{‘first’, ‘last’, False }，默認 ‘first’

處理刪除重複項的方法：

‘first’：刪除除第一次出現的重複項。
‘last’：刪除除最後一次之外的重複項。
False ：刪除所有重複項。

inplace：布爾值，默認 False

如果 True ，就地執行操作並返回 None。

係列或無: 如果 inplace=True ，則刪除重複的係列或 None 。

例子：

>>> s = cudf.Series(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'],
...               name='animal')
>>> s
0      lama
1       cow
2      lama
3    beetle
4      lama
5     hippo
Name: animal, dtype: object

使用keep 參數，可以更改重複值的選擇行為。值‘first’ 保留每組重複條目的第一次出現。保持的默認值為‘first’。請注意，返回的行的順序不能保證是排序的。

>>> s.drop_duplicates()
3    beetle
1       cow
5     hippo
0      lama
Name: animal, dtype: object

參數keep 的值‘last’ 保留每組重複條目的最後一次出現。

>>> s.drop_duplicates(keep='last')
3    beetle
1       cow
5     hippo
4      lama
Name: animal, dtype: object

參數keep 的值False 丟棄所有重複條目集。將 ‘inplace’ 的值設置為 True 會就地執行操作並返回 None 。

>>> s.drop_duplicates(keep=False, inplace=True)
>>> s
3    beetle
1       cow
5     hippo
Name: animal, dtype: object

相關用法

注：本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cudf.Series.drop_duplicates。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

例子：