用法:
pandas.qcut(x, q, labels=None, retbins=False, precision=3, duplicates='raise')
基于分位数的离散化函数。
根据排名或基于样本分位数将变量离散到equal-sized 桶中。例如,10 个分位数的 1000 个值将生成一个分类对象,指示每个数据点的分位数成员资格。
- x:一维 ndarray 或系列
- q:整数或浮点数的list-like
分位数。 10 表示十分位数,4 表示四分位数等。交替排列的分位数,例如[0, .25, .5, .75, 1.] 四分位数。
- labels:数组或假,默认无
用作结果箱的标签。必须与生成的 bin 长度相同。如果为 False,则仅返回 bin 的整数指示符。如果为 True,则引发错误。
- retbins:布尔型,可选
是否返回(箱,标签)。如果 bins 作为标量给出,则可能很有用。
- precision:整数,可选
存储和显示 bin 标签的精度。
- duplicates:{默认 ‘raise’, ‘drop’},可选
如果 bin 边不是唯一的,则引发 ValueError 或删除非唯一的。
- out:如果标签为 False,则为分类或系列或整数数组
返回类型(分类或系列)取决于输入:如果输入是系列,则为类别类型的系列,否则为分类。当返回分类数据时,bin 表示为类别。
- bins:浮点数数组
仅当
retbins
为 True 时返回。
参数:
返回:
注意:
在结果分类对象中,越界值将是 NA
例子:
>>> pd.qcut(range(5), 4) ... [(-0.001, 1.0], (-0.001, 1.0], (1.0, 2.0], (2.0, 3.0], (3.0, 4.0]] Categories (4, interval[float64, right]):[(-0.001, 1.0] < (1.0, 2.0] ...
>>> pd.qcut(range(5), 3, labels=["good", "medium", "bad"]) ... [good, good, medium, bad, bad] Categories (3, object):[good < medium < bad]
>>> pd.qcut(range(5), 4, labels=False) array([0, 0, 1, 2, 3])
相关用法
- Python pandas.arrays.IntervalArray.is_empty用法及代码示例
- Python pandas.DataFrame.ewm用法及代码示例
- Python pandas.api.types.is_timedelta64_ns_dtype用法及代码示例
- Python pandas.DataFrame.dot用法及代码示例
- Python pandas.DataFrame.apply用法及代码示例
- Python pandas.DataFrame.combine_first用法及代码示例
- Python pandas.read_pickle用法及代码示例
- Python pandas.Index.value_counts用法及代码示例
- Python pandas.DatetimeTZDtype用法及代码示例
- Python pandas.DataFrame.cumsum用法及代码示例
- Python pandas.Interval.is_empty用法及代码示例
- Python pandas.api.indexers.FixedForwardWindowIndexer用法及代码示例
- Python pandas.core.resample.Resampler.nearest用法及代码示例
- Python pandas.Series.add_prefix用法及代码示例
- Python pandas.Period.strftime用法及代码示例
- Python pandas.Series.map用法及代码示例
- Python pandas.Series.max用法及代码示例
- Python pandas.DataFrame.rename用法及代码示例
- Python pandas.DataFrame.to_numpy用法及代码示例
- Python pandas.Period.dayofyear用法及代码示例
注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.qcut。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。