當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python SciPy stats.ttest_rel用法及代碼示例


本文簡要介紹 python 語言中 scipy.stats.ttest_rel 的用法。

用法:

scipy.stats.ttest_rel(a, b, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)#

在兩個相關的分數樣本 a 和 b 上計算 t-test。

這是對兩個相關或重複樣本具有相同平均(預期)值的零假設的檢驗。

參數

a, b array_like

數組必須具有相同的形狀。

axis int 或無,默認值:0

如果是 int,則計算統計量的輸入軸。輸入的每個axis-slice(例如行)的統計信息將出現在輸出的相應元素中。如果 None ,輸入將在計算統計數據之前被分解。

nan_policy {‘propagate’, ‘omit’, ‘raise’}

定義如何處理輸入 NaN。

  • propagate :如果計算統計數據的軸切片(例如行)中存在NaN,則輸出的相應條目將為 NaN。

  • omit : 計算時將省略NaNs。如果計算統計數據的軸切片中剩餘的數據不足,則輸出的相應條目將為 NaN。

  • raise :如果存在 NaN,則會引發 ValueError

alternative {‘雙麵’,‘less’, ‘greater’},可選

定義備擇假設。可以使用以下選項(默認為“雙麵”):

  • “雙麵”:樣本的分布均值不相等。

  • ‘less’:第一個樣本的分布平均值小於第二個樣本的分布平均值。

  • ‘greater’:第一個樣本的分布平均值大於第二個樣本的分布平均值。

keepdims 布爾值,默認值:假

如果將其設置為 True,則縮小的軸將作為尺寸為 1 的尺寸留在結果中。使用此選項,結果將針對輸入數組正確廣播。

返回

result TtestResult

具有以下屬性的對象:

統計 浮點數或數組

t-statistic。

p值 浮點數或數組

與給定替代方案相關的 p 值。

df 浮點數或數組

t-statistic計算中使用的自由度數;這比樣本大小 (a.shape[axis]) 小一。

該對象還具有以下方法:

confidence_interval(confidence_level=0.95)

計算給定置信水平下總體均值差異的置信區間。置信區間以namedtuple帶字段低的高的.

注意

使用的示例是同一組學生在不同考試中的分數,或從同一單元重複抽樣。該測試衡量樣本(例如考試)的平均分數是否存在顯著差異。如果我們觀察到較大的 p 值,例如大於 0.05 或 0.1,則我們不能拒絕相同平均分數的原假設。如果 p 值小於閾值,例如1%、5% 或 10%,那麽我們拒絕相等平均值的原假設。小 p 值與大 t-statistics 相關。

t-statistic 計算為 np.mean(a - b)/se ,其中 se 是標準錯誤。因此,當 a - b 的樣本均值大於零時,t-statistic 將為正,而當 a - b 的樣本均值小於零時,t-statistic 將為負。

從 SciPy 1.9 開始,np.matrix 輸入(不建議用於新代碼)在執行計算之前轉換為 np.ndarray。在這種情況下,輸出將是標量或適當形狀的 np.ndarray 而不是 2D np.matrix 。同樣,雖然屏蔽數組的屏蔽元素被忽略,但輸出將是標量或 np.ndarray 而不是帶有 mask=False 的屏蔽數組。

參考

https://en.wikipedia.org/wiki/T-test#Dependent_t-test_for_paired_samples

例子

>>> import numpy as np
>>> from scipy import stats
>>> rng = np.random.default_rng()
>>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng)
>>> rvs2 = (stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng)
...         + stats.norm.rvs(scale=0.2, size=500, random_state=rng))
>>> stats.ttest_rel(rvs1, rvs2)
TtestResult(statistic=-0.4549717054410304, pvalue=0.6493274702088672, df=499)  # noqa
>>> rvs3 = (stats.norm.rvs(loc=8, scale=10, size=500, random_state=rng)
...         + stats.norm.rvs(scale=0.2, size=500, random_state=rng))
>>> stats.ttest_rel(rvs1, rvs3)
TtestResult(statistic=-5.879467544540889, pvalue=7.540777129099917e-09, df=499)  # noqa

相關用法


注:本文由純淨天空篩選整理自scipy.org大神的英文原創作品 scipy.stats.ttest_rel。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。