Pandas cut()函数用于将数组元素分成不同的箱。 cut函数主要用于对标量数据进行统计分析。
用法:cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates=”raise”,)
参数:
x:要合并的输入数组。必须为一维。
bins:定义分割的bin边。
right :(布尔值,默认为True)指示箱子是否包括最右边。如果right == True(默认值),则箱子[1、2、3、4]表示(1,2],(2,3],(3,4]。
labels: (数组或布尔值,可选)指定返回的容器的标签。必须与生成的箱子长度相同。如果为False,则仅返回箱子的整数指示符。
retbins :(布尔型,默认为False)是否返回箱子。当垃圾桶作为标量提供时很有用。
范例1:假设我们有一个10个随机数的数组,范围是1到100,我们希望将数据分成5个bin,分别为(1,20],(20,40],(40,60],(60,80] ,(80,100]。
Python3
import pandas as pd
import numpy as np
df= pd.DataFrame({'number':np.random.randint(1, 100, 10)})
df['bins'] = pd.cut(x=df['number'], bins=[1, 20, 40, 60,
80, 100])
print(df)
# We can check the frequency of each bin
print(df['bins'].unique())
输出:
范例2:我们还可以将标签添加到箱子中,例如,让我们看一下前面的示例,并向其中添加一些标签
Python3
import pandas as pd
import numpy as np
df = pd.DataFrame({'number':np.random.randint(1, 100, 10)})
df['bins'] = pd.cut(x=df['number'], bins=[1, 20, 40, 60, 80, 100],
labels=['1 to 20', '21 to 40', '41 to 60',
'61 to 80', '81 to 100'])
print(df)
# We can check the frequency of each bin
print(df['bins'].unique())
输出:
相关用法
- Python os.dup()用法及代码示例
- Python set()用法及代码示例
- Python next()用法及代码示例
- Python os._exit()用法及代码示例
- Python PIL GaussianBlur()用法及代码示例
- Python os.truncate()用法及代码示例
- Python os.mkfifo()用法及代码示例
- Python os.fsdecode()用法及代码示例
- Python sys.getallocatedblocks()用法及代码示例
- Python os.openpty()用法及代码示例
- Python os.pipe()用法及代码示例
- Python PIL blend()用法及代码示例
- Python PIL copy()用法及代码示例
- Python PIL ImageChops.add()用法及代码示例
- Python PIL composite()用法及代码示例
- Python PyTorch cos()用法及代码示例
- Python PyTorch tan()用法及代码示例
- Python os.setreuid()用法及代码示例
注:本文由纯净天空筛选整理自svrrrsvr大神的英文原创作品 Pandas.cut() method in Python。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。