當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pandas.qcut用法及代碼示例

用法:

pandas.qcut(x, q, labels=None, retbins=False, precision=3, duplicates='raise')

基於分位數的離散化函數。

根據排名或基於樣本分位數將變量離散到equal-sized 桶中。例如,10 個分位數的 1000 個值將生成一個分類對象,指示每個數據點的分位數成員資格。

參數

x一維 ndarray 或係列
q整數或浮點數的list-like

分位數。 10 表示十分位數,4 表示四分位數等。交替排列的分位數,例如[0, .25, .5, .75, 1.] 四分位數。

labels數組或假,默認無

用作結果箱的標簽。必須與生成的 bin 長度相同。如果為 False,則僅返回 bin 的整數指示符。如果為 True,則引發錯誤。

retbins布爾型,可選

是否返回(箱,標簽)。如果 bins 作為標量給出,則可能很有用。

precision整數,可選

存儲和顯示 bin 標簽的精度。

duplicates{默認 ‘raise’, ‘drop’},可選

如果 bin 邊不是唯一的,則引發 ValueError 或刪除非唯一的。

返回

out如果標簽為 False,則為分類或係列或整數數組

返回類型(分類或係列)取決於輸入:如果輸入是係列,則為類別類型的係列,否則為分類。當返回分類數據時,bin 表示為類別。

bins浮點數數組

僅當 retbins 為 True 時返回。

注意

在結果分類對象中,越界值將是 NA

例子

>>> pd.qcut(range(5), 4)
... 
[(-0.001, 1.0], (-0.001, 1.0], (1.0, 2.0], (2.0, 3.0], (3.0, 4.0]]
Categories (4, interval[float64, right]):[(-0.001, 1.0] < (1.0, 2.0] ...
>>> pd.qcut(range(5), 3, labels=["good", "medium", "bad"])
... 
[good, good, medium, bad, bad]
Categories (3, object):[good < medium < bad]
>>> pd.qcut(range(5), 4, labels=False)
array([0, 0, 1, 2, 3])

相關用法


注:本文由純淨天空篩選整理自pandas.pydata.org大神的英文原創作品 pandas.qcut。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。