当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python SciPy stats.ttest_rel用法及代码示例


本文简要介绍 python 语言中 scipy.stats.ttest_rel 的用法。

用法:

scipy.stats.ttest_rel(a, b, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)#

在两个相关的分数样本 a 和 b 上计算 t-test。

这是对两个相关或重复样本具有相同平均(预期)值的零假设的检验。

参数

a, b array_like

数组必须具有相同的形状。

axis int 或无,默认值:0

如果是 int,则计算统计量的输入轴。输入的每个axis-slice(例如行)的统计信息将出现在输出的相应元素中。如果 None ,输入将在计算统计数据之前被分解。

nan_policy {‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

  • propagate :如果计算统计数据的轴切片(例如行)中存在NaN,则输出的相应条目将为 NaN。

  • omit : 计算时将省略NaNs。如果计算统计数据的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。

  • raise :如果存在 NaN,则会引发 ValueError

alternative {‘双面’,‘less’, ‘greater’},可选

定义备择假设。可以使用以下选项(默认为“双面”):

  • “双面”:样本的分布均值不相等。

  • ‘less’:第一个样本的分布平均值小于第二个样本的分布平均值。

  • ‘greater’:第一个样本的分布平均值大于第二个样本的分布平均值。

keepdims 布尔值,默认值:假

如果将其设置为 True,则缩小的轴将作为尺寸为 1 的尺寸留在结果中。使用此选项,结果将针对输入数组正确广播。

返回

result TtestResult

具有以下属性的对象:

统计 浮点数或数组

t-statistic。

p值 浮点数或数组

与给定替代方案相关的 p 值。

df 浮点数或数组

t-statistic计算中使用的自由度数;这比样本大小 (a.shape[axis]) 小一。

该对象还具有以下方法:

confidence_interval(confidence_level=0.95)

计算给定置信水平下总体均值差异的置信区间。置信区间以namedtuple带字段低的高的.

注意

使用的示例是同一组学生在不同考试中的分数,或从同一单元重复抽样。该测试衡量样本(例如考试)的平均分数是否存在显著差异。如果我们观察到较大的 p 值,例如大于 0.05 或 0.1,则我们不能拒绝相同平均分数的原假设。如果 p 值小于阈值,例如1%、5% 或 10%,那么我们拒绝相等平均值的原假设。小 p 值与大 t-statistics 相关。

t-statistic 计算为 np.mean(a - b)/se ,其中 se 是标准错误。因此,当 a - b 的样本均值大于零时,t-statistic 将为正,而当 a - b 的样本均值小于零时,t-statistic 将为负。

从 SciPy 1.9 开始,np.matrix 输入(不建议用于新代码)在执行计算之前转换为 np.ndarray。在这种情况下,输出将是标量或适当形状的 np.ndarray 而不是 2D np.matrix 。同样,虽然屏蔽数组的屏蔽元素被忽略,但输出将是标量或 np.ndarray 而不是带有 mask=False 的屏蔽数组。

参考

https://en.wikipedia.org/wiki/T-test#Dependent_t-test_for_paired_samples

例子

>>> import numpy as np
>>> from scipy import stats
>>> rng = np.random.default_rng()
>>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng)
>>> rvs2 = (stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng)
...         + stats.norm.rvs(scale=0.2, size=500, random_state=rng))
>>> stats.ttest_rel(rvs1, rvs2)
TtestResult(statistic=-0.4549717054410304, pvalue=0.6493274702088672, df=499)  # noqa
>>> rvs3 = (stats.norm.rvs(loc=8, scale=10, size=500, random_state=rng)
...         + stats.norm.rvs(scale=0.2, size=500, random_state=rng))
>>> stats.ttest_rel(rvs1, rvs3)
TtestResult(statistic=-5.879467544540889, pvalue=7.540777129099917e-09, df=499)  # noqa

相关用法


注:本文由纯净天空筛选整理自scipy.org大神的英文原创作品 scipy.stats.ttest_rel。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。