當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python Pandas TimedeltaIndex.drop_duplicates用法及代碼示例


Python是進行數據分析的一種出色語言,主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。

Pandas TimedeltaIndex.drop_duplicates()函數返回刪除重複值的索引。該函數提供了選擇保留哪個重複值並讓其下降的靈活性。

用法: TimedeltaIndex.drop_duplicates(keep=’first’)

參數:
keep:{'first','last',False},默認為'first'
->first:除第一個匹配項外,刪除重複項。
->last:除去最後一次出現的重複項。
->False:丟棄所有重複項

返回:重複數據刪除:索引

範例1:采用TimedeltaIndex.drop_duplicates()函數刪除給定TimedeltaIndex對象中的所有重複值。僅保留第一次出現。

# importing pandas as pd 
import pandas as pd 
  
# Create the TimedeltaIndex object 
tidx = pd.TimedeltaIndex(data =['06:05:01.000030', '+23:59:59.999999', 
                                '22 day 2 min 3us 10ns', '+23:59:59.999999',  
                                '+23:29:59.999999', '+12:19:59.999999']) 
  
# Print the TimedeltaIndex object 
print(tidx)

輸出:

現在我們將使用TimedeltaIndex.drop_duplicates()函數保留所有重複值,同時保留第一次出現的值。

# drop all duplicates and keep the first occurrence 
tidx.drop_duplicates(keep ='first')

輸出:

正如我們在輸出中看到的,TimedeltaIndex.drop_duplicates()函數已返回一個新對象,該對象除去了第一次出現的所有重複值。

範例2:采用TimedeltaIndex.drop_duplicates()函數刪除給定TimedeltaIndex對象中的所有重複值。保留最後一個重複值。

# importing pandas as pd 
import pandas as pd 
  
# Create the TimedeltaIndex object 
tidx = pd.TimedeltaIndex(data =['1 days 02:00:00', '1 days 06:05:01.000030', 
           '1 days 02:00:00', '1 days 02:00:00', '21 days 06:15:01.000030']) 
  
# Print the TimedeltaIndex object 
print(tidx)

輸出:

現在我們將使用TimedeltaIndex.drop_duplicates()函數保留所有重複值,同時保留最後一次出現。

# drop all duplicates and keep the first occurrence 
tidx.drop_duplicates(keep ='last')

輸出:

正如我們在輸出中看到的,TimedeltaIndex.drop_duplicates()函數已返回一個新對象,該對象除去了最後一次出現的所有重複值。



相關用法


注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas TimedeltaIndex.drop_duplicates。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。