当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python SciPy stats.ranksums用法及代码示例


本文简要介绍 python 语言中 scipy.stats.ranksums 的用法。

用法:

scipy.stats.ranksums(x, y, alternative='two-sided', *, axis=0, nan_policy='propagate', keepdims=False)#

计算两个样本的 Wilcoxon rank-sum 统计量。

Wilcoxon rank-sum 检验检验两组测量值来自同一分布的原假设。另一种假设是一个样本中的值更有可能大于另一个样本中的值。

该检验应用于比较来自连续分布的两个样本。它不处理 x 和 y 中的测量值之间的关系。对于tie-handling 和可选的连续性校正,请参见 scipy.stats.mannwhitneyu

参数

x,y array_like

来自两个样本的数据。

alternative {‘双面’,‘less’, ‘greater’},可选

定义备择假设。默认为“双面”。可以使用以下选项:

  • “双面”:其中一个分布(基础 x 或 y)随机大于另一个。

  • ‘less’:x 的分布随机小于 y 的分布。

  • ‘greater’:x 的分布随机大于 y 的分布。

axis int 或无,默认值:0

如果是 int,则计算统计量的输入轴。输入的每个axis-slice(例如行)的统计信息将出现在输出的相应元素中。如果 None ,输入将在计算统计数据之前被分解。

nan_policy {‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

  • propagate :如果计算统计数据的轴切片(例如行)中存在NaN,则输出的相应条目将为 NaN。

  • omit : 计算时将省略NaNs。如果计算统计数据的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。

  • raise :如果存在 NaN,则会引发 ValueError

keepdims 布尔值,默认值:假

如果将其设置为 True,则缩小的轴将作为尺寸为 1 的尺寸留在结果中。使用此选项,结果将针对输入数组正确广播。

返回

statistic 浮点数

large-sample 近似下的检验统计量,秩和统计量呈正态分布。

pvalue 浮点数

检验的 p 值。

注意

从 SciPy 1.9 开始,np.matrix 输入(不建议用于新代码)在执行计算之前转换为 np.ndarray。在这种情况下,输出将是标量或适当形状的 np.ndarray 而不是 2D np.matrix 。同样,虽然屏蔽数组的屏蔽元素被忽略,但输出将是标量或 np.ndarray 而不是带有 mask=False 的屏蔽数组。

参考

例子

我们可以通过计算 Wilcoxon rank-sum 统计量来检验两个独立的 unequal-sized 样本来自同一分布的假设。

>>> import numpy as np
>>> from scipy.stats import ranksums
>>> rng = np.random.default_rng()
>>> sample1 = rng.uniform(-1, 1, 200)
>>> sample2 = rng.uniform(-0.5, 1.5, 300) # a shifted distribution
>>> ranksums(sample1, sample2)
RanksumsResult(statistic=-7.887059, pvalue=3.09390448e-15)  # may vary
>>> ranksums(sample1, sample2, alternative='less')
RanksumsResult(statistic=-7.750585297581713, pvalue=4.573497606342543e-15) # may vary
>>> ranksums(sample1, sample2, alternative='greater')
RanksumsResult(statistic=-7.750585297581713, pvalue=0.9999999999999954) # may vary

p 值小于 0.05 表示此检验拒绝 5% 显著性水平的假设。

相关用法


注:本文由纯净天空筛选整理自scipy.org大神的英文原创作品 scipy.stats.ranksums。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。