Python SciPy stats.levene用法及代码示例

本文简要介绍 python 语言中 scipy.stats.levene 的用法。

用法: scipy.stats.levene(*samples, center='median', proportiontocut=0.05)#

对等方差执行 Levene 检验。

Levene 检验检验所有输入样本均来自方差相等的总体的原假设。在与正态性存在显著偏差的情况下，Levene 检验是 Bartlett 检验 bartlett 的替代方案。

参数：：

sample1, sample2, …： array_like: 样本数据，可能具有不同的长度。只接受一维样本。
center： {‘mean’, ‘median’, ‘trimmed’}，可选: 在测试中使用数据的哪个函数。默认值为‘median’。
proportiontocut：浮点数，可选: 什么时候中央是‘trimmed’，这给出了从每一端切割的数据点的比例。 (看scipy.stats.trim_mean.) 默认值为 0.05。

statistic：浮点数: 检验统计量。
pvalue：浮点数: 检验的 p 值。

注意：

Levene 测试的三种变体是可能的。可能性及其推荐的用法是：

‘median’ : Recommended for skewed (non-normal) distributions>

‘mean’ : Recommended for symmetric, moderate-tailed distributions.

‘trimmed’ : Recommended for heavy-tailed distributions.

使用均值的测试版本是在 Levene 的原始文章([2])中提出的，而 Brown 和 Forsythe([3])研究了中位数和修剪后的均值，有时也称为Brown-Forsythe 测试。

参考：

[1]

https://www.itl.nist.gov/div898/handbook/eda/section3/eda35a.htm

[2]

Levene, H. (1960)。在对概率和统计的贡献：纪念哈罗德·霍特林的论文，I. Olkin 等人。 eds.，斯坦福大学出版社，第 278-292 页。

[3]

Brown, M. B. 和 Forsythe, A. B. (1974)，美国统计协会杂志，69, 364-367

[4]

C.I. BLISS (1952)，生物测定统计：特别参考维生素，第 499-503 页，DOI:10.1016/C2013-0-12584-6。

[5]

B. Phipson 和 G. K. Smyth。 “排列 P 值不应该为零：随机抽取排列时计算精确的 P 值。”遗传学和分子生物学中的统计应用 9.1 (2010)。

[6]

勒德布鲁克，J. 和达德利，H. (1998)。为什么排列检验在生物医学研究中优于 t 和 F 检验。《美国统计学家》，52(2), 127-132。

例子：

文献[4]研究了维生素C对豚鼠牙齿生长的影响。在一项对照研究中，60 名受试者被分为小剂量组、中剂量组和大剂量组，分别每天服用 0.5、1.0 和 2.0 毫克维生素 C。 42天后，测量牙齿的生长情况。

下面的 small_dose 、 medium_dose 和 large_dose 数组记录了三组的牙齿生长测量值(以微米为单位)。

>>> import numpy as np
>>> small_dose = np.array([
...     4.2, 11.5, 7.3, 5.8, 6.4, 10, 11.2, 11.2, 5.2, 7,
...     15.2, 21.5, 17.6, 9.7, 14.5, 10, 8.2, 9.4, 16.5, 9.7
... ])
>>> medium_dose = np.array([
...     16.5, 16.5, 15.2, 17.3, 22.5, 17.3, 13.6, 14.5, 18.8, 15.5,
...     19.7, 23.3, 23.6, 26.4, 20, 25.2, 25.8, 21.2, 14.5, 27.3
... ])
>>> large_dose = np.array([
...     23.6, 18.5, 33.9, 25.5, 26.4, 32.5, 26.7, 21.5, 23.3, 29.5,
...     25.5, 26.4, 22.4, 24.5, 24.8, 30.9, 26.4, 27.3, 29.4, 23
... ])

levene 统计量对样本之间的方差差异敏感。

>>> from scipy import stats
>>> res = stats.levene(small_dose, medium_dose, large_dose)
>>> res.statistic
0.6457341109631506

当方差差异较大时，统计量的值往往较高。

我们可以通过将统计量的观测值与零分布进行比较来测试组之间的方差不等性：零分布是在三组总体方差相等的零假设下得出的统计值的分布。

对于此测试，零分布遵循 F 分布，如下所示。

>>> import matplotlib.pyplot as plt
>>> k, n = 3, 60   # number of samples, total number of observations
>>> dist = stats.f(dfn=k-1, dfd=n-k)
>>> val = np.linspace(0, 5, 100)
>>> pdf = dist.pdf(val)
>>> fig, ax = plt.subplots(figsize=(8, 5))
>>> def plot(ax):  # we'll re-use this
...     ax.plot(val, pdf, color='C0')
...     ax.set_title("Levene Test Null Distribution")
...     ax.set_xlabel("statistic")
...     ax.set_ylabel("probability density")
...     ax.set_xlim(0, 5)
...     ax.set_ylim(0, 1)
>>> plot(ax)
>>> plt.show()

比较通过 p 值进行量化：零分布中大于或等于统计观测值的值的比例。

>>> fig, ax = plt.subplots(figsize=(8, 5))
>>> plot(ax)
>>> pvalue = dist.sf(res.statistic)
>>> annotation = (f'p-value={pvalue:.3f}\n(shaded area)')
>>> props = dict(facecolor='black', width=1, headwidth=5, headlength=8)
>>> _ = ax.annotate(annotation, (1.5, 0.22), (2.25, 0.3), arrowprops=props)
>>> i = val >= res.statistic
>>> ax.fill_between(val[i], y1=0, y2=pdf[i], color='C0')
>>> plt.show()

>>> res.pvalue
0.5280694573759905

如果 p 值为 “small” - 也就是说，如果从具有相同方差的分布中采样数据产生统计量极值的概率较低 - 这可以作为反对零假设的证据另一种选择：各组的方差不相等。注意：

反之则不成立；也就是说，检验不用于为原假设提供证据。
将被视为 “small” 的值的阈值是在分析数据之前应做出的选择 [5]，同时考虑误报(错误地拒绝原假设)和漏报(未能拒绝假设)的风险。错误的原假设)。
p 值小并不能证明效果大；相反，它们只能为 “significant” 效应提供证据，这意味着它们不太可能在原假设下发生。

请注意，F 分布提供了零分布的渐近近似。对于小样本，执行排列检验可能更合适：在所有三个样本均来自同一总体的零假设下，每个测量值在三个样本中的任何一个中观察到的可能性相同。因此，我们可以通过计算将观测值划分为三个样本的许多 randomly-generated 下的统计量来形成随机零分布。

>>> def statistic(*samples):
...     return stats.levene(*samples).statistic
>>> ref = stats.permutation_test(
...     (small_dose, medium_dose, large_dose), statistic,
...     permutation_type='independent', alternative='greater'
... )
>>> fig, ax = plt.subplots(figsize=(8, 5))
>>> plot(ax)
>>> bins = np.linspace(0, 5, 25)
>>> ax.hist(
...     ref.null_distribution, bins=bins, density=True, facecolor="C1"
... )
>>> ax.legend(['aymptotic approximation\n(many observations)',
...            'randomized null distribution'])
>>> plot(ax)
>>> plt.show()

>>> ref.pvalue  # randomized test p-value
0.4559  # may vary

请注意，此处计算的 p 值与上面 levene 返回的渐近近似值之间存在显著差异。从排列检验中严格得出的统计推论是有限的；尽管如此，在许多情况下它们可能是首选方法[6]。

以下是另一个一般示例，其中原假设将被拒绝。

测试列表 a、b 和 c 是否来自具有相等方差的总体。

>>> a = [8.88, 9.12, 9.04, 8.98, 9.00, 9.08, 9.01, 8.85, 9.06, 8.99]
>>> b = [8.88, 8.95, 9.29, 9.44, 9.15, 9.58, 8.36, 9.18, 8.67, 9.05]
>>> c = [8.95, 9.12, 8.95, 8.85, 9.03, 8.84, 9.07, 8.98, 8.86, 8.98]
>>> stat, p = stats.levene(a, b, c)
>>> p
0.002431505967249681

小 p 值表明总体方差不相等。

这并不奇怪，因为 b 的样本方差远大于 a 和 c 的样本方差：

>>> [np.var(x, ddof=1) for x in [a, b, c]]
[0.007054444444444413, 0.13073888888888888, 0.008890000000000002]

相关用法

注：本文由纯净天空筛选整理自scipy.org大神的英文原创作品 scipy.stats.levene。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数 ：：

返回 ：：

注意：

参考：

例子：

参数：：

返回：：