当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas Index.duplicated()用法及代码示例


Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Pandas Index.duplicated()函数指示重复的索引值。重复的值在结果数组中表示为True值。可以指示所有重复项,除了第一个重复项之外的所有重复项,或者可以指示除了最后一次重复项以外的所有重复项。

用法: Index.duplicated(keep=’first’)

参数:
keep:{'first','last',False},默认为'first'
一组重复项中的一个或多个值标记为丢失。
->‘first’:将第一个重复项标记为True。
->‘last’:将最后一次出现的重复项标记为True。
->False:将所有重复项标记为True。

返回:numpy.ndarray

范例1:采用Index.duplicated()函数用于指示索引中除第一个值外的所有重复值。

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',  
                      'Lhasa', 'Husky', 'Beagle']) 
  
# Print the Index 
idx

输出:

我们来看一下索引中存在的值是重复值还是唯一值。

# Identify the duplicated values except the first 
idx.duplicated(keep ='first')

输出:

正如我们在输出中看到的,Index.duplicated()函数已将所有重复值的出现标记为True除了第一次出现。

范例2:采用Index.duplicated()识别所有重复值的函数。这里所有重复的值都将标记为True

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index([100, 50, 45, 100, 12, 50, None]) 
  
# Print the Index 
idx

输出:

让我们确定索引中所有重复的值。

注意:我们正在吃饭NaN索引中的值。

# Identify all duplicated occurrence of values 
idx.duplicated(keep = False)

输出:

该函数已将所有重复值标记为True。它还处理了单发的NaN值是唯一的,并将其标记为false。



相关用法


注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas Index.duplicated()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。