當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python SciPy stats.kruskal用法及代碼示例


本文簡要介紹 python 語言中 scipy.stats.kruskal 的用法。

用法:

scipy.stats.kruskal(*samples, nan_policy='propagate', axis=0, keepdims=False)#

計算獨立樣本的Kruskal-Wallis H-test。

Kruskal-Wallis H-test 檢驗所有組的總體中位數相等的原假設。它是 ANOVA 的非參數版本。該測試適用於 2 個或更多獨立樣本,這些樣本可能具有不同的大小。請注意,拒絕原假設並不表示哪個組不同。需要在組之間進行事後比較以確定哪些組不同。

參數

sample1, sample2, … array_like

具有樣本測量值的兩個或多個數組可以作為參數給出。樣本必須是一維的。

nan_policy {‘propagate’, ‘omit’, ‘raise’}

定義如何處理輸入 NaN。

  • propagate :如果計算統計數據的軸切片(例如行)中存在NaN,則輸出的相應條目將為 NaN。

  • omit : 計算時將省略NaNs。如果計算統計數據的軸切片中剩餘的數據不足,則輸出的相應條目將為 NaN。

  • raise :如果存在 NaN,則會引發 ValueError

axis int 或無,默認值:0

如果是 int,則計算統計量的輸入軸。輸入的每個axis-slice(例如行)的統計信息將出現在輸出的相應元素中。如果 None ,輸入將在計算統計數據之前被分解。

keepdims 布爾值,默認值:假

如果將其設置為 True,則縮小的軸將作為尺寸為 1 的尺寸留在結果中。使用此選項,結果將針對輸入數組正確廣播。

返回

statistic 浮點數

Kruskal-Wallis H 統計數據,已針對平局進行了校正。

pvalue 浮點數

使用 H 具有卡方分布的假設進行檢驗的 p 值。返回的 p 值是在 H 處評估的卡方分布的生存函數。

注意

由於假設 H 具有卡方分布,因此每組中的樣本數不能太少。一個典型的規則是每個樣本必須至少有 5 次測量。

從 SciPy 1.9 開始,np.matrix 輸入(不建議用於新代碼)在執行計算之前轉換為 np.ndarray。在這種情況下,輸出將是標量或適當形狀的 np.ndarray 而不是 2D np.matrix 。同樣,雖然屏蔽數組的屏蔽元素被忽略,但輸出將是標量或 np.ndarray 而不是帶有 mask=False 的屏蔽數組。

參考

[1]

W. H. Kruskal 和 W. W. Wallis,“One-Criterion 方差分析中排名的使用”,美國統計協會雜誌,卷。 47,第 260 期,第 583-621 頁,1952 年。

例子

>>> from scipy import stats
>>> x = [1, 3, 5, 7, 9]
>>> y = [2, 4, 6, 8, 10]
>>> stats.kruskal(x, y)
KruskalResult(statistic=0.2727272727272734, pvalue=0.6015081344405895)
>>> x = [1, 1, 1]
>>> y = [2, 2, 2]
>>> z = [2, 2]
>>> stats.kruskal(x, y, z)
KruskalResult(statistic=7.0, pvalue=0.0301973834223185)

相關用法


注:本文由純淨天空篩選整理自scipy.org大神的英文原創作品 scipy.stats.kruskal。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。