當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python Pandas.cut()用法及代碼示例


Pandas cut()函數用於將數組元素分成不同的箱。 cut函數主要用於對標量數據進行統計分析。

用法:cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates=”raise”,)

參數:

x:要合並的輸入數組。必須為一維。

bins:定義分割的bin邊。



right :(布爾值,默認為True)指示箱子是否包括最右邊。如果right == True(默認值),則箱子[1、2、3、4]表示(1,2],(2,3],(3,4]。

labels: (數組或布爾值,可選)指定返回的容器的標簽。必須與生成的箱子長度相同。如果為False,則僅返回箱子的整數指示符。

retbins :(布爾型,默認為False)是否返回箱子。當垃圾桶作為標量提供時很有用。

範例1:假設我們有一個10個隨機數的數組,範圍是1到100,我們希望將數據分成5個bin,分別為(1,20],(20,40],(40,60],(60,80] ,(80,100]。

Python3

import pandas as pd 
import numpy as np 
  
  
df= pd.DataFrame({'number':np.random.randint(1, 100, 10)}) 
df['bins'] = pd.cut(x=df['number'], bins=[1, 20, 40, 60,  
                                          80, 100]) 
print(df) 
  
# We can check the frequency of each bin 
print(df['bins'].unique())

輸出:

範例2:我們還可以將標簽添加到箱子中,例如,讓我們看一下前麵的示例,並向其中添加一些標簽

Python3

import pandas as pd 
import numpy as np 
  
df = pd.DataFrame({'number':np.random.randint(1, 100, 10)}) 
df['bins'] = pd.cut(x=df['number'], bins=[1, 20, 40, 60, 80, 100], 
                    labels=['1 to 20', '21 to 40', '41 to 60', 
                            '61 to 80', '81 to 100']) 
  
print(df) 
  
# We can check the frequency of each bin 
print(df['bins'].unique())

輸出:




相關用法


注:本文由純淨天空篩選整理自svrrrsvr大神的英文原創作品 Pandas.cut() method in Python。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。