当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python statistics.quantiles用法及代码示例


用法:

statistics.quantiles(data, *, n=4, method='exclusive')

以相等的概率将data 分成n 连续区间。返回分隔区间的n - 1 切割点列表。

n 设置为四分位数 4(默认值)。将 n 设置为 10 表示十分位数。将 n 设置为百分位数 100,这给出了将 data 分成 100 个大小相等的组的 99 个分割点。如果 n 不小于 1,则提高 StatisticsError

data 可以是包含样本数据的任何可迭代对象。对于有意义的结果,data 中的数据点数应大于 n 。如果没有至少两个数据点,则引发 StatisticsError

从两个最近的数据点线性插值切割点。例如,如果切割点落在两个样本值之间的距离的 one-third 上,100112 ,则 cut-point 将评估为 104

用于计算分位数的 method 可以根据 data 是否包括或排除总体中的最低和最高可能值而变化。

默认的 method 是 “exclusive”,用于从总体中采样的数据,这些数据的极端值可能比样本中的值更多。低于 m 排序数据点的 i-th 的人口部分计算为 i / (m + 1) 。给定九个样本值,该方法对它们进行排序并分配以下百分位数:10%、20%、30%、40%、50%、60%、70%、80%、90%。

method 设置为“inclusive” 用于说明总体数据或已知包含总体中最极端值的样本。 data 中的最小值被视为第 0 个百分位,最大值被视为第 100 个百分位。低于 m 排序数据点的 i-th 的人口部分计算为 (i - 1) / (m - 1) 。给定 11 个样本值,该方法对它们进行排序并分配以下百分位数:0%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%。

# Decile cut points for empirically sampled data
>>> data = [105, 129, 87, 86, 111, 111, 89, 81, 108, 92, 110,
...         100, 75, 105, 103, 109, 76, 119, 99, 91, 103, 129,
...         106, 101, 84, 111, 74, 87, 86, 103, 103, 106, 86,
...         111, 75, 87, 102, 121, 111, 88, 89, 101, 106, 95,
...         103, 107, 101, 81, 109, 104]
>>> [round(q, 1) for q in quantiles(data, n=10)]
[81.0, 86.2, 89.0, 99.4, 102.5, 103.6, 106.0, 109.8, 111.0]

3.8 版中的新函数。

相关用法


注:本文由纯净天空筛选整理自python.org大神的英文原创作品 statistics.quantiles。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。