Python pandas.qcut用法及代碼示例

用法: pandas.qcut(x, q, labels=None, retbins=False, precision=3, duplicates='raise')

基於分位數的離散化函數。

根據排名或基於樣本分位數將變量離散到equal-sized 桶中。例如，10 個分位數的 1000 個值將生成一個分類對象，指示每個數據點的分位數成員資格。

參數：

x：一維 ndarray 或係列
q：整數或浮點數的list-like: 分位數。 10 表示十分位數，4 表示四分位數等。交替排列的分位數，例如[0, .25, .5, .75, 1.] 四分位數。
labels：數組或假，默認無: 用作結果箱的標簽。必須與生成的 bin 長度相同。如果為 False，則僅返回 bin 的整數指示符。如果為 True，則引發錯誤。
retbins：布爾型，可選: 是否返回(箱，標簽)。如果 bins 作為標量給出，則可能很有用。
precision：整數，可選: 存儲和顯示 bin 標簽的精度。
duplicates：{默認 ‘raise’, ‘drop’}，可選: 如果 bin 邊不是唯一的，則引發 ValueError 或刪除非唯一的。

out：如果標簽為 False，則為分類或係列或整數數組

返回類型(分類或係列)取決於輸入：如果輸入是係列，則為類別類型的係列，否則為分類。當返回分類數據時，bin 表示為類別。

bins：浮點數數組

僅當 retbins 為 True 時返回。

注意：

在結果分類對象中，越界值將是 NA

例子：

>>> pd.qcut(range(5), 4)
... 
[(-0.001, 1.0], (-0.001, 1.0], (1.0, 2.0], (2.0, 3.0], (3.0, 4.0]]
Categories (4, interval[float64, right]):[(-0.001, 1.0] < (1.0, 2.0] ...

>>> pd.qcut(range(5), 3, labels=["good", "medium", "bad"])
... 
[good, good, medium, bad, bad]
Categories (3, object):[good < medium < bad]

>>> pd.qcut(range(5), 4, labels=False)
array([0, 0, 1, 2, 3])

相關用法

注：本文由純淨天空篩選整理自pandas.pydata.org大神的英文原創作品 pandas.qcut。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

注意：

例子：