Python Pandas.cut()用法及代碼示例

Pandas cut()函數用於將數組元素分成不同的箱。 cut函數主要用於對標量數據進行統計分析。

用法：cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates=”raise”,)

參數：

x:要合並的輸入數組。必須為一維。

bins：定義分割的bin邊。

right ：(布爾值，默認為True)指示箱子是否包括最右邊。如果right == True(默認值)，則箱子[1、2、3、4]表示(1,2]，(2,3]，(3,4]。

labels: (數組或布爾值，可選)指定返回的容器的標簽。必須與生成的箱子長度相同。如果為False，則僅返回箱子的整數指示符。

retbins ：(布爾型，默認為False)是否返回箱子。當垃圾桶作為標量提供時很有用。

範例1：假設我們有一個10個隨機數的數組，範圍是1到100，我們希望將數據分成5個bin，分別為(1,20]，(20,40]，(40,60]，(60,80] ，(80,100]。

Python3

import pandas as pd 
import numpy as np 
  
  
df= pd.DataFrame({'number':np.random.randint(1, 100, 10)}) 
df['bins'] = pd.cut(x=df['number'], bins=[1, 20, 40, 60,  
                                          80, 100]) 
print(df) 
  
# We can check the frequency of each bin 
print(df['bins'].unique())

輸出：

範例2：我們還可以將標簽添加到箱子中，例如，讓我們看一下前麵的示例，並向其中添加一些標簽

Python3

import pandas as pd 
import numpy as np 
  
df = pd.DataFrame({'number':np.random.randint(1, 100, 10)}) 
df['bins'] = pd.cut(x=df['number'], bins=[1, 20, 40, 60, 80, 100], 
                    labels=['1 to 20', '21 to 40', '41 to 60', 
                            '61 to 80', '81 to 100']) 
  
print(df) 
  
# We can check the frequency of each bin 
print(df['bins'].unique())

輸出：

相關用法

注：本文由純淨天空篩選整理自svrrrsvr大神的英文原創作品 Pandas.cut() method in Python。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。