当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas.cut()用法及代码示例


Pandas cut()函数用于将数组元素分成不同的箱。 cut函数主要用于对标量数据进行统计分析。

用法:cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates=”raise”,)

参数:

x:要合并的输入数组。必须为一维。

bins:定义分割的bin边。



right :(布尔值,默认为True)指示箱子是否包括最右边。如果right == True(默认值),则箱子[1、2、3、4]表示(1,2],(2,3],(3,4]。

labels: (数组或布尔值,可选)指定返回的容器的标签。必须与生成的箱子长度相同。如果为False,则仅返回箱子的整数指示符。

retbins :(布尔型,默认为False)是否返回箱子。当垃圾桶作为标量提供时很有用。

范例1:假设我们有一个10个随机数的数组,范围是1到100,我们希望将数据分成5个bin,分别为(1,20],(20,40],(40,60],(60,80] ,(80,100]。

Python3

import pandas as pd 
import numpy as np 
  
  
df= pd.DataFrame({'number':np.random.randint(1, 100, 10)}) 
df['bins'] = pd.cut(x=df['number'], bins=[1, 20, 40, 60,  
                                          80, 100]) 
print(df) 
  
# We can check the frequency of each bin 
print(df['bins'].unique())

输出:

范例2:我们还可以将标签添加到箱子中,例如,让我们看一下前面的示例,并向其中添加一些标签

Python3

import pandas as pd 
import numpy as np 
  
df = pd.DataFrame({'number':np.random.randint(1, 100, 10)}) 
df['bins'] = pd.cut(x=df['number'], bins=[1, 20, 40, 60, 80, 100], 
                    labels=['1 to 20', '21 to 40', '41 to 60', 
                            '61 to 80', '81 to 100']) 
  
print(df) 
  
# We can check the frequency of each bin 
print(df['bins'].unique())

输出:




相关用法


注:本文由纯净天空筛选整理自svrrrsvr大神的英文原创作品 Pandas.cut() method in Python。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。