当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas Index.get_duplicates()用法及代码示例


Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Pandas Index.get_duplicates()函数提取重复的索引元素。此函数返回索引元素的排序列表,这些索引元素在Index中出现多次。

用法: Index.get_duplicates() 

返回值:重复索引列表。

范例1:采用Index.get_duplicates()函数查找索引中的所有重复值。

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index(['Labrador', 'Beagle', 'Labrador', 
                    'Lhasa', 'Husky', 'Beagle']) 
  
# Print the Index 
idx

输出:

让我们找出索引中所有重复的值。

# print the duplicated values. 
idx.get_duplicates()

输出:

正如我们在输出中看到的,Index.get_duplicates()函数已返回在索引中具有多个出现的所有值。

范例2:采用Index.get_duplicates()函数查找索引中的所有重复项。该索引还包含NaN值。

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index(['Labrador', 'Beagle', None, 'Labrador', 
             'Lhasa', 'Husky', 'Beagle', None, 'Koala']) 
  
# Print the Index 
idx

输出:

从输出中可以看到,我们缺少一些值。让我们看看Index.get_duplicates()函数对待他们。

# print the duplicate values in Index 
idx.get_duplicates()

输出:

多次出现缺失值已被视为重复项。



相关用法


注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas Index.get_duplicates()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。