Python statistics.quantiles用法及代碼示例

用法: statistics.quantiles(data, *, n=4, method='exclusive')

以相等的概率將data 分成n 連續區間。返回分隔區間的n - 1 切割點列表。

將 n 設置為四分位數 4(默認值)。將 n 設置為 10 表示十分位數。將 n 設置為百分位數 100，這給出了將 data 分成 100 個大小相等的組的 99 個分割點。如果 n 不小於 1，則提高 StatisticsError。

data 可以是包含樣本數據的任何可迭代對象。對於有意義的結果，data 中的數據點數應大於 n 。如果沒有至少兩個數據點，則引發 StatisticsError。

從兩個最近的數據點線性插值切割點。例如，如果切割點落在兩個樣本值之間的距離的 one-third 上，100 和 112 ，則 cut-point 將評估為 104 。

用於計算分位數的 method 可以根據 data 是否包括或排除總體中的最低和最高可能值而變化。

默認的 method 是 “exclusive”，用於從總體中采樣的數據，這些數據的極端值可能比樣本中的值更多。低於 m 排序數據點的 i-th 的人口部分計算為 i / (m + 1) 。給定九個樣本值，該方法對它們進行排序並分配以下百分位數：10%、20%、30%、40%、50%、60%、70%、80%、90%。

將method 設置為“inclusive” 用於說明總體數據或已知包含總體中最極端值的樣本。 data 中的最小值被視為第 0 個百分位，最大值被視為第 100 個百分位。低於 m 排序數據點的 i-th 的人口部分計算為 (i - 1) / (m - 1) 。給定 11 個樣本值，該方法對它們進行排序並分配以下百分位數：0%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%。

# Decile cut points for empirically sampled data
>>> data = [105, 129, 87, 86, 111, 111, 89, 81, 108, 92, 110,
...         100, 75, 105, 103, 109, 76, 119, 99, 91, 103, 129,
...         106, 101, 84, 111, 74, 87, 86, 103, 103, 106, 86,
...         111, 75, 87, 102, 121, 111, 88, 89, 101, 106, 95,
...         103, 107, 101, 81, 109, 104]
>>> [round(q, 1) for q in quantiles(data, n=10)]
[81.0, 86.2, 89.0, 99.4, 102.5, 103.6, 106.0, 109.8, 111.0]

3.8 版中的新函數。

相關用法

注：本文由純淨天空篩選整理自python.org大神的英文原創作品 statistics.quantiles。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。