本文簡要介紹 python 語言中 scipy.stats.ttest_1samp
的用法。
用法:
scipy.stats.ttest_1samp(a, popmean, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)#
計算一組分數的平均值的T-test。
這是對獨立觀測樣本 a 的期望值(均值)等於給定總體均值 popmean 的零假設的檢驗。
- a: array_like
樣品觀察。
- popmean: float 或 數組
原假設中的期望值。如果是 數組,那麽它沿軸的長度必須等於 1,否則它必須可以通過 a 進行廣播。
- axis: int 或無,默認值:0
如果是 int,則計算統計量的輸入軸。輸入的每個axis-slice(例如行)的統計信息將出現在輸出的相應元素中。如果
None
,輸入將在計算統計數據之前被分解。- nan_policy: {‘propagate’, ‘omit’, ‘raise’}
定義如何處理輸入 NaN。
propagate
:如果計算統計數據的軸切片(例如行)中存在NaN,則輸出的相應條目將為 NaN。omit
: 計算時將省略NaNs。如果計算統計數據的軸切片中剩餘的數據不足,則輸出的相應條目將為 NaN。raise
:如果存在 NaN,則會引發ValueError
。
- alternative: {‘雙麵’,‘less’, ‘greater’},可選
定義備擇假設。可以使用以下選項(默認為“雙麵”):
“雙麵”:樣本基本分布的均值與給定總體均值 (popmean) 不同
‘less’:樣本基本分布的均值小於給定總體均值 (popmean)
‘greater’:樣本基礎分布的均值大於給定總體均值 (popmean)
- keepdims: 布爾值,默認值:假
如果將其設置為 True,則縮小的軸將作為尺寸為 1 的尺寸留在結果中。使用此選項,結果將針對輸入數組正確廣播。
- result:
TtestResult
具有以下屬性的對象:
- 統計 浮點數或數組
t-statistic。
- p值 浮點數或數組
與給定替代方案相關的 p 值。
- df 浮點數或數組
t-statistic計算中使用的自由度數;這比樣本大小 (
a.shape[axis]
) 小一。
該對象還具有以下方法:
- confidence_interval(confidence_level=0.95)
計算給定置信水平的總體平均值周圍的置信區間。置信區間以
namedtuple
帶字段低的和高的.
- result:
參數 ::
返回 ::
注意:
統計量計算為
(np.mean(a) - popmean)/se
,其中se
是標準誤差。因此,當樣本均值大於總體均值時統計量為正,當樣本均值小於總體均值時統計量為負。從 SciPy 1.9 開始,
np.matrix
輸入(不建議用於新代碼)在執行計算之前轉換為np.ndarray
。在這種情況下,輸出將是標量或適當形狀的np.ndarray
而不是 2Dnp.matrix
。同樣,雖然屏蔽數組的屏蔽元素被忽略,但輸出將是標量或np.ndarray
而不是帶有mask=False
的屏蔽數組。例子:
假設我們希望檢驗總體均值等於 0.5 的原假設。我們選擇99%的置信度;也就是說,如果 p 值小於 0.01,我們將拒絕原假設並支持替代假設。
當測試平均值為 0.5 的標準均勻分布的隨機變量時,我們期望數據在大多數情況下與原假設一致。
>>> import numpy as np >>> from scipy import stats >>> rng = np.random.default_rng() >>> rvs = stats.uniform.rvs(size=50, random_state=rng) >>> stats.ttest_1samp(rvs, popmean=0.5) TtestResult(statistic=2.456308468440, pvalue=0.017628209047638, df=49)
正如預期的那樣,p 值 0.017 不低於我們的閾值 0.01,因此我們不能拒絕原假設。
當測試均值為 0 的標準正態分布數據時,我們預計原假設會被拒絕。
>>> rvs = stats.norm.rvs(size=50, random_state=rng) >>> stats.ttest_1samp(rvs, popmean=0.5) TtestResult(statistic=-7.433605518875, pvalue=1.416760157221e-09, df=49)
事實上,p 值低於我們的閾值 0.01,因此我們拒絕零假設,轉而支持默認的 “two-sided” 替代方案:總體平均值不等於 0.5。
然而,假設我們要針對總體均值大於 0.5 的片麵替代方案檢驗原假設。由於標準正態分布的均值小於 0.5,因此我們不會期望原假設被拒絕。
>>> stats.ttest_1samp(rvs, popmean=0.5, alternative='greater') TtestResult(statistic=-7.433605518875, pvalue=0.99999999929, df=49)
毫不奇怪,當 p 值大於我們的閾值時,我們不會拒絕原假設。
請注意,當置信水平為 99% 時,大約 1% 的時間將拒絕真正的原假設。
>>> rvs = stats.uniform.rvs(size=(100, 50), random_state=rng) >>> res = stats.ttest_1samp(rvs, popmean=0.5, axis=1) >>> np.sum(res.pvalue < 0.01) 1
事實上,即使上述所有 100 個樣本都是從標準均勻分布中抽取的(總體平均值確實為 0.5),我們仍會錯誤地拒絕其中一個樣本的原假設。
ttest_1samp
還可以計算總體平均值周圍的置信區間。>>> rvs = stats.norm.rvs(size=50, random_state=rng) >>> res = stats.ttest_1samp(rvs, popmean=0) >>> ci = res.confidence_interval(confidence_level=0.95) >>> ci ConfidenceInterval(low=-0.3193887540880017, high=0.2898583388980972)
95% 置信區間的界限是參數 popmean 的最小值和最大值,其中檢驗的 p 值為 0.05。
>>> res = stats.ttest_1samp(rvs, popmean=ci.low) >>> np.testing.assert_allclose(res.pvalue, 0.05) >>> res = stats.ttest_1samp(rvs, popmean=ci.high) >>> np.testing.assert_allclose(res.pvalue, 0.05)
在對從中抽取樣本的總體進行某些假設的情況下,置信水平為 95% 的置信區間預計將包含 95% 的樣本重複中的真實總體均值。
>>> rvs = stats.norm.rvs(size=(50, 1000), loc=1, random_state=rng) >>> res = stats.ttest_1samp(rvs, popmean=0) >>> ci = res.confidence_interval() >>> contains_pop_mean = (ci.low < 1) & (ci.high > 1) >>> contains_pop_mean.sum() 953
相關用法
- Python SciPy stats.ttest_rel用法及代碼示例
- Python SciPy stats.ttest_ind_from_stats用法及代碼示例
- Python SciPy stats.ttest_ind用法及代碼示例
- Python SciPy stats.theilslopes用法及代碼示例
- Python SciPy stats.triang用法及代碼示例
- Python SciPy stats.t用法及代碼示例
- Python SciPy stats.tvar用法及代碼示例
- Python SciPy stats.trim_mean用法及代碼示例
- Python SciPy stats.tsem用法及代碼示例
- Python SciPy stats.truncpareto用法及代碼示例
- Python SciPy stats.tmean用法及代碼示例
- Python SciPy stats.truncweibull_min用法及代碼示例
- Python SciPy stats.trim1用法及代碼示例
- Python SciPy stats.tmin用法及代碼示例
- Python SciPy stats.trimboth用法及代碼示例
- Python SciPy stats.tmax用法及代碼示例
- Python SciPy stats.truncexpon用法及代碼示例
- Python SciPy stats.truncnorm用法及代碼示例
- Python SciPy stats.tukeylambda用法及代碼示例
- Python SciPy stats.trapezoid用法及代碼示例
- Python SciPy stats.tstd用法及代碼示例
- Python SciPy stats.tiecorrect用法及代碼示例
- Python SciPy stats.tukey_hsd用法及代碼示例
- Python SciPy stats.anderson用法及代碼示例
- Python SciPy stats.iqr用法及代碼示例
注:本文由純淨天空篩選整理自scipy.org大神的英文原創作品 scipy.stats.ttest_1samp。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。