本文简要介绍 python 语言中 scipy.stats.ttest_1samp
的用法。
用法:
scipy.stats.ttest_1samp(a, popmean, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)#
计算一组分数的平均值的T-test。
这是对独立观测样本 a 的期望值(均值)等于给定总体均值 popmean 的零假设的检验。
- a: array_like
样品观察。
- popmean: float 或 数组
原假设中的期望值。如果是 数组,那么它沿轴的长度必须等于 1,否则它必须可以通过 a 进行广播。
- axis: int 或无,默认值:0
如果是 int,则计算统计量的输入轴。输入的每个axis-slice(例如行)的统计信息将出现在输出的相应元素中。如果
None
,输入将在计算统计数据之前被分解。- nan_policy: {‘propagate’, ‘omit’, ‘raise’}
定义如何处理输入 NaN。
propagate
:如果计算统计数据的轴切片(例如行)中存在NaN,则输出的相应条目将为 NaN。omit
: 计算时将省略NaNs。如果计算统计数据的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。raise
:如果存在 NaN,则会引发ValueError
。
- alternative: {‘双面’,‘less’, ‘greater’},可选
定义备择假设。可以使用以下选项(默认为“双面”):
“双面”:样本基本分布的均值与给定总体均值 (popmean) 不同
‘less’:样本基本分布的均值小于给定总体均值 (popmean)
‘greater’:样本基础分布的均值大于给定总体均值 (popmean)
- keepdims: 布尔值,默认值:假
如果将其设置为 True,则缩小的轴将作为尺寸为 1 的尺寸留在结果中。使用此选项,结果将针对输入数组正确广播。
- result:
TtestResult
具有以下属性的对象:
- 统计 浮点数或数组
t-statistic。
- p值 浮点数或数组
与给定替代方案相关的 p 值。
- df 浮点数或数组
t-statistic计算中使用的自由度数;这比样本大小 (
a.shape[axis]
) 小一。
该对象还具有以下方法:
- confidence_interval(confidence_level=0.95)
计算给定置信水平的总体平均值周围的置信区间。置信区间以
namedtuple
带字段低的和高的.
- result:
参数 ::
返回 ::
注意:
统计量计算为
(np.mean(a) - popmean)/se
,其中se
是标准误差。因此,当样本均值大于总体均值时统计量为正,当样本均值小于总体均值时统计量为负。从 SciPy 1.9 开始,
np.matrix
输入(不建议用于新代码)在执行计算之前转换为np.ndarray
。在这种情况下,输出将是标量或适当形状的np.ndarray
而不是 2Dnp.matrix
。同样,虽然屏蔽数组的屏蔽元素被忽略,但输出将是标量或np.ndarray
而不是带有mask=False
的屏蔽数组。例子:
假设我们希望检验总体均值等于 0.5 的原假设。我们选择99%的置信度;也就是说,如果 p 值小于 0.01,我们将拒绝原假设并支持替代假设。
当测试平均值为 0.5 的标准均匀分布的随机变量时,我们期望数据在大多数情况下与原假设一致。
>>> import numpy as np >>> from scipy import stats >>> rng = np.random.default_rng() >>> rvs = stats.uniform.rvs(size=50, random_state=rng) >>> stats.ttest_1samp(rvs, popmean=0.5) TtestResult(statistic=2.456308468440, pvalue=0.017628209047638, df=49)
正如预期的那样,p 值 0.017 不低于我们的阈值 0.01,因此我们不能拒绝原假设。
当测试均值为 0 的标准正态分布数据时,我们预计原假设会被拒绝。
>>> rvs = stats.norm.rvs(size=50, random_state=rng) >>> stats.ttest_1samp(rvs, popmean=0.5) TtestResult(statistic=-7.433605518875, pvalue=1.416760157221e-09, df=49)
事实上,p 值低于我们的阈值 0.01,因此我们拒绝零假设,转而支持默认的 “two-sided” 替代方案:总体平均值不等于 0.5。
然而,假设我们要针对总体均值大于 0.5 的片面替代方案检验原假设。由于标准正态分布的均值小于 0.5,因此我们不会期望原假设被拒绝。
>>> stats.ttest_1samp(rvs, popmean=0.5, alternative='greater') TtestResult(statistic=-7.433605518875, pvalue=0.99999999929, df=49)
毫不奇怪,当 p 值大于我们的阈值时,我们不会拒绝原假设。
请注意,当置信水平为 99% 时,大约 1% 的时间将拒绝真正的原假设。
>>> rvs = stats.uniform.rvs(size=(100, 50), random_state=rng) >>> res = stats.ttest_1samp(rvs, popmean=0.5, axis=1) >>> np.sum(res.pvalue < 0.01) 1
事实上,即使上述所有 100 个样本都是从标准均匀分布中抽取的(总体平均值确实为 0.5),我们仍会错误地拒绝其中一个样本的原假设。
ttest_1samp
还可以计算总体平均值周围的置信区间。>>> rvs = stats.norm.rvs(size=50, random_state=rng) >>> res = stats.ttest_1samp(rvs, popmean=0) >>> ci = res.confidence_interval(confidence_level=0.95) >>> ci ConfidenceInterval(low=-0.3193887540880017, high=0.2898583388980972)
95% 置信区间的界限是参数 popmean 的最小值和最大值,其中检验的 p 值为 0.05。
>>> res = stats.ttest_1samp(rvs, popmean=ci.low) >>> np.testing.assert_allclose(res.pvalue, 0.05) >>> res = stats.ttest_1samp(rvs, popmean=ci.high) >>> np.testing.assert_allclose(res.pvalue, 0.05)
在对从中抽取样本的总体进行某些假设的情况下,置信水平为 95% 的置信区间预计将包含 95% 的样本重复中的真实总体均值。
>>> rvs = stats.norm.rvs(size=(50, 1000), loc=1, random_state=rng) >>> res = stats.ttest_1samp(rvs, popmean=0) >>> ci = res.confidence_interval() >>> contains_pop_mean = (ci.low < 1) & (ci.high > 1) >>> contains_pop_mean.sum() 953
相关用法
- Python SciPy stats.ttest_rel用法及代码示例
- Python SciPy stats.ttest_ind_from_stats用法及代码示例
- Python SciPy stats.ttest_ind用法及代码示例
- Python SciPy stats.theilslopes用法及代码示例
- Python SciPy stats.triang用法及代码示例
- Python SciPy stats.t用法及代码示例
- Python SciPy stats.tvar用法及代码示例
- Python SciPy stats.trim_mean用法及代码示例
- Python SciPy stats.tsem用法及代码示例
- Python SciPy stats.truncpareto用法及代码示例
- Python SciPy stats.tmean用法及代码示例
- Python SciPy stats.truncweibull_min用法及代码示例
- Python SciPy stats.trim1用法及代码示例
- Python SciPy stats.tmin用法及代码示例
- Python SciPy stats.trimboth用法及代码示例
- Python SciPy stats.tmax用法及代码示例
- Python SciPy stats.truncexpon用法及代码示例
- Python SciPy stats.truncnorm用法及代码示例
- Python SciPy stats.tukeylambda用法及代码示例
- Python SciPy stats.trapezoid用法及代码示例
- Python SciPy stats.tstd用法及代码示例
- Python SciPy stats.tiecorrect用法及代码示例
- Python SciPy stats.tukey_hsd用法及代码示例
- Python SciPy stats.anderson用法及代码示例
- Python SciPy stats.iqr用法及代码示例
注:本文由纯净天空筛选整理自scipy.org大神的英文原创作品 scipy.stats.ttest_1samp。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。