当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas TimedeltaIndex.drop_duplicates用法及代码示例


Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Pandas TimedeltaIndex.drop_duplicates()函数返回删除重复值的索引。该函数提供了选择保留哪个重复值并让其下降的灵活性。

用法: TimedeltaIndex.drop_duplicates(keep=’first’)

参数:
keep:{'first','last',False},默认为'first'
->first:除第一个匹配项外,删除重复项。
->last:除去最后一次出现的重复项。
->False:丢弃所有重复项

返回:重复数据删除:索引

范例1:采用TimedeltaIndex.drop_duplicates()函数删除给定TimedeltaIndex对象中的所有重复值。仅保留第一次出现。

# importing pandas as pd 
import pandas as pd 
  
# Create the TimedeltaIndex object 
tidx = pd.TimedeltaIndex(data =['06:05:01.000030', '+23:59:59.999999', 
                                '22 day 2 min 3us 10ns', '+23:59:59.999999',  
                                '+23:29:59.999999', '+12:19:59.999999']) 
  
# Print the TimedeltaIndex object 
print(tidx)

输出:

现在我们将使用TimedeltaIndex.drop_duplicates()函数保留所有重复值,同时保留第一次出现的值。

# drop all duplicates and keep the first occurrence 
tidx.drop_duplicates(keep ='first')

输出:

正如我们在输出中看到的,TimedeltaIndex.drop_duplicates()函数已返回一个新对象,该对象除去了第一次出现的所有重复值。

范例2:采用TimedeltaIndex.drop_duplicates()函数删除给定TimedeltaIndex对象中的所有重复值。保留最后一个重复值。

# importing pandas as pd 
import pandas as pd 
  
# Create the TimedeltaIndex object 
tidx = pd.TimedeltaIndex(data =['1 days 02:00:00', '1 days 06:05:01.000030', 
           '1 days 02:00:00', '1 days 02:00:00', '21 days 06:15:01.000030']) 
  
# Print the TimedeltaIndex object 
print(tidx)

输出:

现在我们将使用TimedeltaIndex.drop_duplicates()函数保留所有重复值,同时保留最后一次出现。

# drop all duplicates and keep the first occurrence 
tidx.drop_duplicates(keep ='last')

输出:

正如我们在输出中看到的,TimedeltaIndex.drop_duplicates()函数已返回一个新对象,该对象除去了最后一次出现的所有重复值。



相关用法


注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas TimedeltaIndex.drop_duplicates。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。