Pandas DataFrame.duplicated(~)
方法返回一係列布爾值,其中 True
表示重複行。
參數
1.subset
| string
或array-like
或string
| optional
要考慮的列的標簽。默認情況下,會考慮所有列。
2. keep
| boolean
或 string
| optional
重複的標記規則:
值 |
說明 |
---|---|
|
除了第一個之外,所有重複項都標記為 |
|
除了最後一個之外,所有重複項都標記為 |
|
所有重複項都標記為 |
默認情況下,keep="first"
。
返回值
Series
,其中 True
表示重複行。
例子
考慮以下 DataFrame :
df = pd.DataFrame({"A":[1,2,1], "B":[3,4,3]})
df
A B
0 1 3
1 2 4
2 1 3
這裏,第一行和第三行是重複的。
指定保持參數
第一的
要標記除第一行之外的所有重複行:
df.duplicated() # or explicitly set keep="first"
0 False
1 False
2 True
dtype: bool
最後的
要標記除最後一行之外的所有重複行:
df.duplicated(keep="last")
0 True
1 False
2 False
dtype: bool
False
要將所有重複行標記為 True
:
df.duplicated(keep=False)
0 True
1 False
2 True
dtype: bool
相關用法
- Python PySpark DataFrame dtypes屬性用法及代碼示例
- Python PySpark DataFrame drop方法用法及代碼示例
- Python Pandas DataFrame dtypes屬性用法及代碼示例
- Python PySpark DataFrame dropDuplicates方法用法及代碼示例
- Python Pandas DataFrame drop_duplicates方法用法及代碼示例
- Python Pandas DataFrame diff方法用法及代碼示例
- Python Pandas DataFrame dot方法用法及代碼示例
- Python Pandas DataFrame describe方法用法及代碼示例
- Python PySpark DataFrame describe方法用法及代碼示例
- Python Pandas DataFrame div方法用法及代碼示例
- Python Pandas DataFrame drop方法用法及代碼示例
- Python Pandas DataFrame droplevel方法用法及代碼示例
- Python PySpark DataFrame dropna方法用法及代碼示例
- Python Pandas DataFrame dropna方法用法及代碼示例
- Python PySpark DataFrame distinct方法用法及代碼示例
- Python Pandas DataFrame empty屬性用法及代碼示例
- Python Pandas DataFrame pop方法用法及代碼示例
- Python Pandas DataFrame nsmallest方法用法及代碼示例
- Python Pandas DataFrame sample方法用法及代碼示例
- Python Pandas DataFrame items方法用法及代碼示例
- Python Pandas DataFrame max方法用法及代碼示例
- Python Pandas DataFrame swaplevel方法用法及代碼示例
- Python Pandas DataFrame agg方法用法及代碼示例
- Python Pandas DataFrame copy方法用法及代碼示例
- Python Pandas DataFrame pow方法用法及代碼示例
注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 Pandas DataFrame | duplicated method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。