Python numpy quantile用法及代码示例

本文简要介绍 python 语言中 numpy.quantile 的用法。

用法: numpy.quantile(a, q, axis=None, out=None, overwrite_input=False, method='linear', keepdims=False, *, interpolation=None)

沿指定轴计算数据的q-th 分位数。

参数：

a： array_like

可以转换为数组的输入数组或对象。

q：类似浮点数的数组

要计算的分位数或分位数序列，必须介于 0 和 1 之间。

axis： {int，int 元组，无}，可选

计算分位数的一个或多个轴。默认值是沿数组的扁平化版本计算分位数。

out： ndarray，可选

用于放置结果的替代输出数组。它必须具有与预期输出相同的形状和缓冲区长度，但如有必要，将强制转换(输出的)类型。

overwrite_input：布尔型，可选

如果为 True，则允许通过中间计算修改输入数组 a，以节省内存。在这种情况下，该函数完成后输入 a 的内容是未定义的。

method： str，可选

此参数指定用于估计分位数的方法。有许多不同的方法，其中一些是 NumPy 独有的。请参阅注释以获取解释。 H&F; 论文 [1] 中总结的按 R 类型排序的选项为：

‘inverted_cdf’
‘averaged_inverted_cdf’
‘closest_observation’
‘interpolated_inverted_cdf’
‘hazen’
‘weibull’
‘linear’(默认)
‘median_unbiased’
‘normal_unbiased’

前三种方法是不连续的。 NumPy 进一步定义了默认 ‘linear’ (7.) 选项的以下不连续变体：

‘lower’
‘higher’,
‘midpoint’
‘nearest’

keepdims：布尔型，可选

如果将其设置为 True，则缩小的轴将作为尺寸为 1 的尺寸留在结果中。使用此选项，结果将针对原始数组 a 正确广播。

interpolation： str，可选

方法关键字参数的已弃用名称。

quantile：标量或 ndarray: 如果q是单个分位数并且轴=无, 那么结果是一个标量。如果给出多个分位数，则结果的第一个轴对应于分位数。其他轴是减少后剩余的轴a.如果输入包含整数或浮点数小于float64，输出数据类型为float64.否则，输出数据类型与输入数据类型相同。如果out指定，则返回该数组。

注意：

给定一个向量V长度N, q-th 的分位数V是值q的排序副本中从最小值到最大值的方式V.两个最近邻居的值和距离以及方法如果归一化排名与位置不匹配，参数将确定分位数q确切地。此函数与中位数相同 ifq=0.5，与最小值相同，如果q=0.0并且与最大值相同 ifq=1.0.

这个可选方法参数指定当所需分位数位于两个数据点之间时使用的方法i < j.如果g是被包围的索引的小数部分i和 alpha 和 beta 是修正 i 和 j 的修正常数。

\[i + g = (q - alpha) / ( n - alpha - beta + 1 )\]

然后不同的方法如下工作

inverted_cdf:：

H&F; 的方法 1 [1]。此方法给出不连续的结果： * if g > 0 ;如果 g = 0，则取 j * ；然后带我

averaged_inverted_cdf:：

H&F; 的方法 2 [1]。此方法给出不连续的结果： * if g > 0 ;如果 g = 0，则取 j * ；然后在边界之间求平均值

closest_observation:：

H&F; 的方法 3 [1]。此方法给出不连续的结果： * if g > 0 ;如果 g = 0 并且索引为奇数，则取 j * ；如果 g = 0 并且索引为偶数，则取 j * ；然后带我

interpolated_inverted_cdf:：

H&F; 的方法 4 [1]。此方法使用以下方法给出连续结果： * alpha = 0 * beta = 1

hazen:：

H&F; 的方法 5 [1]。此方法使用以下方法给出连续结果： * alpha = 1/2 * beta = 1/2

weibull:：

H&F; 的方法 6 [1]。此方法使用以下方法给出连续结果： * alpha = 0 * beta = 0

linear:：

H&F; 的方法 7 [1]。此方法使用以下方法给出连续结果： * alpha = 1 * beta = 1

median_unbiased:：

H&F; 的方法 8 [1]。如果样本分布函数未知(请参阅引用)，此方法可能是最好的方法。此方法使用以下方法给出连续结果： * alpha = 1/3 * beta = 1/3

normal_unbiased:：

H&F; 的方法 9 [1]。如果已知样本分布函数是正态的，则此方法可能是最好的方法。此方法使用以下方法给出连续结果： * alpha = 3/8 * beta = 3/8

lower:：

NumPy 方法保留是为了向后兼容。以i为插值点。

higher:：

NumPy 方法保留是为了向后兼容。以j为插值点。

nearest:：

NumPy 方法保留是为了向后兼容。采用 i 或 j ，以最近者为准。

midpoint:：

NumPy 方法保留是为了向后兼容。使用 (i + j) / 2 。

参考：

1 [1,2,3,4,5,6,7,8,9 和 10]：

R. J. Hyndman 和 Y. Fan，“统计包中的样本分位数”，美国统计学家，50(4)，第 361-365 页，1996

例子：

>>> a = np.array([[10, 7, 4], [3, 2, 1]])
>>> a
array([[10,  7,  4],
       [ 3,  2,  1]])
>>> np.quantile(a, 0.5)
3.5
>>> np.quantile(a, 0.5, axis=0)
array([6.5, 4.5, 2.5])
>>> np.quantile(a, 0.5, axis=1)
array([7.,  2.])
>>> np.quantile(a, 0.5, axis=1, keepdims=True)
array([[7.],
       [2.]])
>>> m = np.quantile(a, 0.5, axis=0)
>>> out = np.zeros_like(m)
>>> np.quantile(a, 0.5, axis=0, out=out)
array([6.5, 4.5, 2.5])
>>> m
array([6.5, 4.5, 2.5])
>>> b = a.copy()
>>> np.quantile(b, 0.5, axis=1, overwrite_input=True)
array([7.,  2.])
>>> assert not np.all(a == b)

有关大多数方法的可视化，另请参见 numpy.percentile 。

相关用法

注：本文由纯净天空筛选整理自numpy.org大神的英文原创作品 numpy.quantile。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

注意：