當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python Pandas Index.duplicated()用法及代碼示例


Python是進行數據分析的一種出色語言,主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。

Pandas Index.duplicated()函數指示重複的索引值。重複的值在結果數組中表示為True值。可以指示所有重複項,除了第一個重複項之外的所有重複項,或者可以指示除了最後一次重複項以外的所有重複項。

用法: Index.duplicated(keep=’first’)

參數:
keep:{'first','last',False},默認為'first'
一組重複項中的一個或多個值標記為丟失。
->‘first’:將第一個重複項標記為True。
->‘last’:將最後一次出現的重複項標記為True。
->False:將所有重複項標記為True。

返回:numpy.ndarray

範例1:采用Index.duplicated()函數用於指示索引中除第一個值外的所有重複值。

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',  
                      'Lhasa', 'Husky', 'Beagle']) 
  
# Print the Index 
idx

輸出:

我們來看一下索引中存在的值是重複值還是唯一值。

# Identify the duplicated values except the first 
idx.duplicated(keep ='first')

輸出:

正如我們在輸出中看到的,Index.duplicated()函數已將所有重複值的出現標記為True除了第一次出現。

範例2:采用Index.duplicated()識別所有重複值的函數。這裏所有重複的值都將標記為True

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index([100, 50, 45, 100, 12, 50, None]) 
  
# Print the Index 
idx

輸出:

讓我們確定索引中所有重複的值。

注意:我們正在吃飯NaN索引中的值。

# Identify all duplicated occurrence of values 
idx.duplicated(keep = False)

輸出:

該函數已將所有重複值標記為True。它還處理了單發的NaN值是唯一的,並將其標記為false。



相關用法


注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas Index.duplicated()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。