Python是進行數據分析的一種出色語言,主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。
Pandas Index.duplicated()
函數指示重複的索引值。重複的值在結果數組中表示為True值。可以指示所有重複項,除了第一個重複項之外的所有重複項,或者可以指示除了最後一次重複項以外的所有重複項。
用法: Index.duplicated(keep=’first’)
參數:
keep:{'first','last',False},默認為'first'
一組重複項中的一個或多個值標記為丟失。
->‘first’:將第一個重複項標記為True。
->‘last’:將最後一次出現的重複項標記為True。
->False:將所有重複項標記為True。
返回:numpy.ndarray
範例1:采用Index.duplicated()
函數用於指示索引中除第一個值外的所有重複值。
# importing pandas as pd
import pandas as pd
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',
'Lhasa', 'Husky', 'Beagle'])
# Print the Index
idx
輸出:
我們來看一下索引中存在的值是重複值還是唯一值。
# Identify the duplicated values except the first
idx.duplicated(keep ='first')
輸出:
正如我們在輸出中看到的,Index.duplicated()
函數已將所有重複值的出現標記為True
除了第一次出現。
範例2:采用Index.duplicated()
識別所有重複值的函數。這裏所有重複的值都將標記為True
# importing pandas as pd
import pandas as pd
# Creating the Index
idx = pd.Index([100, 50, 45, 100, 12, 50, None])
# Print the Index
idx
輸出:
讓我們確定索引中所有重複的值。
注意:我們正在吃飯NaN
索引中的值。
# Identify all duplicated occurrence of values
idx.duplicated(keep = False)
輸出:
該函數已將所有重複值標記為True。它還處理了單發的NaN
值是唯一的,並將其標記為false。
相關用法
- Python pandas.map()用法及代碼示例
- Python Pandas Series.str.len()用法及代碼示例
- Python Pandas.factorize()用法及代碼示例
- Python Pandas TimedeltaIndex.name用法及代碼示例
- Python Pandas dataframe.ne()用法及代碼示例
- Python Pandas Series.between()用法及代碼示例
- Python Pandas DataFrame.where()用法及代碼示例
- Python Pandas Series.add()用法及代碼示例
- Python Pandas.pivot_table()用法及代碼示例
- Python Pandas Series.mod()用法及代碼示例
- Python Pandas Dataframe.at[ ]用法及代碼示例
- Python Pandas Dataframe.iat[ ]用法及代碼示例
- Python Pandas.pivot()用法及代碼示例
- Python Pandas dataframe.mul()用法及代碼示例
- Python Pandas.melt()用法及代碼示例
注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas Index.duplicated()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。