Python Pandas Index.duplicated()用法及代碼示例

Python是進行數據分析的一種出色語言，主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種，使導入和分析數據更加容易。

Pandas Index.duplicated()函數指示重複的索引值。重複的值在結果數組中表示為True值。可以指示所有重複項，除了第一個重複項之外的所有重複項，或者可以指示除了最後一次重複項以外的所有重複項。

用法： Index.duplicated(keep=’first’)

參數:
keep:{'first'，'last'，False}，默認為'first'
一組重複項中的一個或多個值標記為丟失。
->‘first’：將第一個重複項標記為True。
->‘last’：將最後一次出現的重複項標記為True。
->False：將所有重複項標記為True。

返回:numpy.ndarray

範例1：采用Index.duplicated()函數用於指示索引中除第一個值外的所有重複值。

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',  
                      'Lhasa', 'Husky', 'Beagle']) 
  
# Print the Index 
idx

輸出：

我們來看一下索引中存在的值是重複值還是唯一值。

# Identify the duplicated values except the first 
idx.duplicated(keep ='first')

輸出：

正如我們在輸出中看到的，Index.duplicated()函數已將所有重複值的出現標記為True除了第一次出現。

範例2：采用Index.duplicated()識別所有重複值的函數。這裏所有重複的值都將標記為True

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index([100, 50, 45, 100, 12, 50, None]) 
  
# Print the Index 
idx

輸出：

讓我們確定索引中所有重複的值。

注意：我們正在吃飯NaN索引中的值。

# Identify all duplicated occurrence of values 
idx.duplicated(keep = False)

輸出：

該函數已將所有重複值標記為True。它還處理了單發的NaN值是唯一的，並將其標記為false。

相關用法

注：本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas Index.duplicated()。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。