Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Pandas Index.duplicated()
函数指示重复的索引值。重复的值在结果数组中表示为True值。可以指示所有重复项,除了第一个重复项之外的所有重复项,或者可以指示除了最后一次重复项以外的所有重复项。
用法: Index.duplicated(keep=’first’)
参数:
keep:{'first','last',False},默认为'first'
一组重复项中的一个或多个值标记为丢失。
->‘first’:将第一个重复项标记为True。
->‘last’:将最后一次出现的重复项标记为True。
->False:将所有重复项标记为True。
返回:numpy.ndarray
范例1:采用Index.duplicated()
函数用于指示索引中除第一个值外的所有重复值。
# importing pandas as pd
import pandas as pd
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',
'Lhasa', 'Husky', 'Beagle'])
# Print the Index
idx
输出:
我们来看一下索引中存在的值是重复值还是唯一值。
# Identify the duplicated values except the first
idx.duplicated(keep ='first')
输出:
正如我们在输出中看到的,Index.duplicated()
函数已将所有重复值的出现标记为True
除了第一次出现。
范例2:采用Index.duplicated()
识别所有重复值的函数。这里所有重复的值都将标记为True
# importing pandas as pd
import pandas as pd
# Creating the Index
idx = pd.Index([100, 50, 45, 100, 12, 50, None])
# Print the Index
idx
输出:
让我们确定索引中所有重复的值。
注意:我们正在吃饭NaN
索引中的值。
# Identify all duplicated occurrence of values
idx.duplicated(keep = False)
输出:
该函数已将所有重复值标记为True。它还处理了单发的NaN
值是唯一的,并将其标记为false。
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas Index.duplicated()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。