用法:
pandas.qcut(x, q, labels=None, retbins=False, precision=3, duplicates='raise')
基於分位數的離散化函數。
根據排名或基於樣本分位數將變量離散到equal-sized 桶中。例如,10 個分位數的 1000 個值將生成一個分類對象,指示每個數據點的分位數成員資格。
- x:一維 ndarray 或係列
- q:整數或浮點數的list-like
分位數。 10 表示十分位數,4 表示四分位數等。交替排列的分位數,例如[0, .25, .5, .75, 1.] 四分位數。
- labels:數組或假,默認無
用作結果箱的標簽。必須與生成的 bin 長度相同。如果為 False,則僅返回 bin 的整數指示符。如果為 True,則引發錯誤。
- retbins:布爾型,可選
是否返回(箱,標簽)。如果 bins 作為標量給出,則可能很有用。
- precision:整數,可選
存儲和顯示 bin 標簽的精度。
- duplicates:{默認 ‘raise’, ‘drop’},可選
如果 bin 邊不是唯一的,則引發 ValueError 或刪除非唯一的。
- out:如果標簽為 False,則為分類或係列或整數數組
返回類型(分類或係列)取決於輸入:如果輸入是係列,則為類別類型的係列,否則為分類。當返回分類數據時,bin 表示為類別。
- bins:浮點數數組
僅當
retbins
為 True 時返回。
參數:
返回:
注意:
在結果分類對象中,越界值將是 NA
例子:
>>> pd.qcut(range(5), 4) ... [(-0.001, 1.0], (-0.001, 1.0], (1.0, 2.0], (2.0, 3.0], (3.0, 4.0]] Categories (4, interval[float64, right]):[(-0.001, 1.0] < (1.0, 2.0] ...
>>> pd.qcut(range(5), 3, labels=["good", "medium", "bad"]) ... [good, good, medium, bad, bad] Categories (3, object):[good < medium < bad]
>>> pd.qcut(range(5), 4, labels=False) array([0, 0, 1, 2, 3])
相關用法
- Python pandas.arrays.IntervalArray.is_empty用法及代碼示例
- Python pandas.DataFrame.ewm用法及代碼示例
- Python pandas.api.types.is_timedelta64_ns_dtype用法及代碼示例
- Python pandas.DataFrame.dot用法及代碼示例
- Python pandas.DataFrame.apply用法及代碼示例
- Python pandas.DataFrame.combine_first用法及代碼示例
- Python pandas.read_pickle用法及代碼示例
- Python pandas.Index.value_counts用法及代碼示例
- Python pandas.DatetimeTZDtype用法及代碼示例
- Python pandas.DataFrame.cumsum用法及代碼示例
- Python pandas.Interval.is_empty用法及代碼示例
- Python pandas.api.indexers.FixedForwardWindowIndexer用法及代碼示例
- Python pandas.core.resample.Resampler.nearest用法及代碼示例
- Python pandas.Series.add_prefix用法及代碼示例
- Python pandas.Period.strftime用法及代碼示例
- Python pandas.Series.map用法及代碼示例
- Python pandas.Series.max用法及代碼示例
- Python pandas.DataFrame.rename用法及代碼示例
- Python pandas.DataFrame.to_numpy用法及代碼示例
- Python pandas.Period.dayofyear用法及代碼示例
注:本文由純淨天空篩選整理自pandas.pydata.org大神的英文原創作品 pandas.qcut。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。