當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python SciPy stats.ranksums用法及代碼示例


本文簡要介紹 python 語言中 scipy.stats.ranksums 的用法。

用法:

scipy.stats.ranksums(x, y, alternative='two-sided', *, axis=0, nan_policy='propagate', keepdims=False)#

計算兩個樣本的 Wilcoxon rank-sum 統計量。

Wilcoxon rank-sum 檢驗檢驗兩組測量值來自同一分布的原假設。另一種假設是一個樣本中的值更有可能大於另一個樣本中的值。

該檢驗應用於比較來自連續分布的兩個樣本。它不處理 x 和 y 中的測量值之間的關係。對於tie-handling 和可選的連續性校正,請參見 scipy.stats.mannwhitneyu

參數

x,y array_like

來自兩個樣本的數據。

alternative {‘雙麵’,‘less’, ‘greater’},可選

定義備擇假設。默認為“雙麵”。可以使用以下選項:

  • “雙麵”:其中一個分布(基礎 x 或 y)隨機大於另一個。

  • ‘less’:x 的分布隨機小於 y 的分布。

  • ‘greater’:x 的分布隨機大於 y 的分布。

axis int 或無,默認值:0

如果是 int,則計算統計量的輸入軸。輸入的每個axis-slice(例如行)的統計信息將出現在輸出的相應元素中。如果 None ,輸入將在計算統計數據之前被分解。

nan_policy {‘propagate’, ‘omit’, ‘raise’}

定義如何處理輸入 NaN。

  • propagate :如果計算統計數據的軸切片(例如行)中存在NaN,則輸出的相應條目將為 NaN。

  • omit : 計算時將省略NaNs。如果計算統計數據的軸切片中剩餘的數據不足,則輸出的相應條目將為 NaN。

  • raise :如果存在 NaN,則會引發 ValueError

keepdims 布爾值,默認值:假

如果將其設置為 True,則縮小的軸將作為尺寸為 1 的尺寸留在結果中。使用此選項,結果將針對輸入數組正確廣播。

返回

statistic 浮點數

large-sample 近似下的檢驗統計量,秩和統計量呈正態分布。

pvalue 浮點數

檢驗的 p 值。

注意

從 SciPy 1.9 開始,np.matrix 輸入(不建議用於新代碼)在執行計算之前轉換為 np.ndarray。在這種情況下,輸出將是標量或適當形狀的 np.ndarray 而不是 2D np.matrix 。同樣,雖然屏蔽數組的屏蔽元素被忽略,但輸出將是標量或 np.ndarray 而不是帶有 mask=False 的屏蔽數組。

參考

例子

我們可以通過計算 Wilcoxon rank-sum 統計量來檢驗兩個獨立的 unequal-sized 樣本來自同一分布的假設。

>>> import numpy as np
>>> from scipy.stats import ranksums
>>> rng = np.random.default_rng()
>>> sample1 = rng.uniform(-1, 1, 200)
>>> sample2 = rng.uniform(-0.5, 1.5, 300) # a shifted distribution
>>> ranksums(sample1, sample2)
RanksumsResult(statistic=-7.887059, pvalue=3.09390448e-15)  # may vary
>>> ranksums(sample1, sample2, alternative='less')
RanksumsResult(statistic=-7.750585297581713, pvalue=4.573497606342543e-15) # may vary
>>> ranksums(sample1, sample2, alternative='greater')
RanksumsResult(statistic=-7.750585297581713, pvalue=0.9999999999999954) # may vary

p 值小於 0.05 表示此檢驗拒絕 5% 顯著性水平的假設。

相關用法


注:本文由純淨天空篩選整理自scipy.org大神的英文原創作品 scipy.stats.ranksums。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。