Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Pandas Index.get_duplicates()
函数提取重复的索引元素。此函数返回索引元素的排序列表,这些索引元素在Index中出现多次。
用法: Index.get_duplicates()
返回值:重复索引列表。
范例1:采用Index.get_duplicates()
函数查找索引中的所有重复值。
# importing pandas as pd
import pandas as pd
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',
'Lhasa', 'Husky', 'Beagle'])
# Print the Index
idx
输出:
让我们找出索引中所有重复的值。
# print the duplicated values.
idx.get_duplicates()
输出:
正如我们在输出中看到的,Index.get_duplicates()
函数已返回在索引中具有多个出现的所有值。
范例2:采用Index.get_duplicates()
函数查找索引中的所有重复项。该索引还包含NaN
值。
# importing pandas as pd
import pandas as pd
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', None, 'Labrador',
'Lhasa', 'Husky', 'Beagle', None, 'Koala'])
# Print the Index
idx
输出:
从输出中可以看到,我们缺少一些值。让我们看看Index.get_duplicates()
函数对待他们。
# print the duplicate values in Index
idx.get_duplicates()
输出:
多次出现缺失值已被视为重复项。
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas Index.get_duplicates()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。