Pandas DataFrame.duplicated(~)
方法返回一系列布尔值,其中 True
表示重复行。
参数
1.subset
| string
或array-like
或string
| optional
要考虑的列的标签。默认情况下,会考虑所有列。
2. keep
| boolean
或 string
| optional
重复的标记规则:
值 |
说明 |
---|---|
|
除了第一个之外,所有重复项都标记为 |
|
除了最后一个之外,所有重复项都标记为 |
|
所有重复项都标记为 |
默认情况下,keep="first"
。
返回值
Series
,其中 True
表示重复行。
例子
考虑以下 DataFrame :
df = pd.DataFrame({"A":[1,2,1], "B":[3,4,3]})
df
A B
0 1 3
1 2 4
2 1 3
这里,第一行和第三行是重复的。
指定保持参数
第一的
要标记除第一行之外的所有重复行:
df.duplicated() # or explicitly set keep="first"
0 False
1 False
2 True
dtype: bool
最后的
要标记除最后一行之外的所有重复行:
df.duplicated(keep="last")
0 True
1 False
2 False
dtype: bool
False
要将所有重复行标记为 True
:
df.duplicated(keep=False)
0 True
1 False
2 True
dtype: bool
相关用法
- Python PySpark DataFrame dtypes属性用法及代码示例
- Python PySpark DataFrame drop方法用法及代码示例
- Python Pandas DataFrame dtypes属性用法及代码示例
- Python PySpark DataFrame dropDuplicates方法用法及代码示例
- Python Pandas DataFrame drop_duplicates方法用法及代码示例
- Python Pandas DataFrame diff方法用法及代码示例
- Python Pandas DataFrame dot方法用法及代码示例
- Python Pandas DataFrame describe方法用法及代码示例
- Python PySpark DataFrame describe方法用法及代码示例
- Python Pandas DataFrame div方法用法及代码示例
- Python Pandas DataFrame drop方法用法及代码示例
- Python Pandas DataFrame droplevel方法用法及代码示例
- Python PySpark DataFrame dropna方法用法及代码示例
- Python Pandas DataFrame dropna方法用法及代码示例
- Python PySpark DataFrame distinct方法用法及代码示例
- Python Pandas DataFrame empty属性用法及代码示例
- Python Pandas DataFrame pop方法用法及代码示例
- Python Pandas DataFrame nsmallest方法用法及代码示例
- Python Pandas DataFrame sample方法用法及代码示例
- Python Pandas DataFrame items方法用法及代码示例
- Python Pandas DataFrame max方法用法及代码示例
- Python Pandas DataFrame swaplevel方法用法及代码示例
- Python Pandas DataFrame agg方法用法及代码示例
- Python Pandas DataFrame copy方法用法及代码示例
- Python Pandas DataFrame pow方法用法及代码示例
注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 Pandas DataFrame | duplicated method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。