Pandas cut()函數用於將數組元素分成不同的箱。 cut函數主要用於對標量數據進行統計分析。
用法:cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates=”raise”,)
參數:
x:要合並的輸入數組。必須為一維。
bins:定義分割的bin邊。
right :(布爾值,默認為True)指示箱子是否包括最右邊。如果right == True(默認值),則箱子[1、2、3、4]表示(1,2],(2,3],(3,4]。
labels: (數組或布爾值,可選)指定返回的容器的標簽。必須與生成的箱子長度相同。如果為False,則僅返回箱子的整數指示符。
retbins :(布爾型,默認為False)是否返回箱子。當垃圾桶作為標量提供時很有用。
範例1:假設我們有一個10個隨機數的數組,範圍是1到100,我們希望將數據分成5個bin,分別為(1,20],(20,40],(40,60],(60,80] ,(80,100]。
Python3
import pandas as pd
import numpy as np
df= pd.DataFrame({'number':np.random.randint(1, 100, 10)})
df['bins'] = pd.cut(x=df['number'], bins=[1, 20, 40, 60,
80, 100])
print(df)
# We can check the frequency of each bin
print(df['bins'].unique())
輸出:
範例2:我們還可以將標簽添加到箱子中,例如,讓我們看一下前麵的示例,並向其中添加一些標簽
Python3
import pandas as pd
import numpy as np
df = pd.DataFrame({'number':np.random.randint(1, 100, 10)})
df['bins'] = pd.cut(x=df['number'], bins=[1, 20, 40, 60, 80, 100],
labels=['1 to 20', '21 to 40', '41 to 60',
'61 to 80', '81 to 100'])
print(df)
# We can check the frequency of each bin
print(df['bins'].unique())
輸出:
相關用法
- Python os.dup()用法及代碼示例
- Python set()用法及代碼示例
- Python next()用法及代碼示例
- Python os._exit()用法及代碼示例
- Python PIL GaussianBlur()用法及代碼示例
- Python os.truncate()用法及代碼示例
- Python os.mkfifo()用法及代碼示例
- Python os.fsdecode()用法及代碼示例
- Python sys.getallocatedblocks()用法及代碼示例
- Python os.openpty()用法及代碼示例
- Python os.pipe()用法及代碼示例
- Python PIL blend()用法及代碼示例
- Python PIL copy()用法及代碼示例
- Python PIL ImageChops.add()用法及代碼示例
- Python PIL composite()用法及代碼示例
- Python PyTorch cos()用法及代碼示例
- Python PyTorch tan()用法及代碼示例
- Python os.setreuid()用法及代碼示例
注:本文由純淨天空篩選整理自svrrrsvr大神的英文原創作品 Pandas.cut() method in Python。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。