當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python SciPy stats.poisson_means_test用法及代碼示例


本文簡要介紹 python 語言中 scipy.stats.poisson_means_test 的用法。

用法:

scipy.stats.poisson_means_test(k1, n1, k2, n2, *, diff=0, alternative='two-sided')#

執行泊鬆均值檢驗,又稱“E-test”。

這是對原假設的檢驗,即兩個泊鬆分布的均值之間的差異為 diff。樣本以在大小為 n1 和 n2 的測量間隔(例如時間、空間、觀察次數)內觀察到的事件 k1 和 k2 的數量提供。

參數

k1 int

從分布中觀察到的事件數 1。

n1: float

分布 1 的樣本大小。

k2 int

從分布中觀察到的事件數量 2。

n2 浮點數

分布 2 的樣本大小。

diff 浮點數,默認=0

樣本基礎分布之間的假設均值差異。

alternative {‘雙麵’,‘less’, ‘greater’},可選

定義備擇假設。可以使用以下選項(默認為“雙麵”):

  • ‘two-sided’: the difference between distribution means is not equal to diff

  • ‘less’: the difference between distribution means is less than diff

  • ‘greater’: the difference between distribution means is greater than diff

返回

statistic 浮點數

檢驗統計量(參見 [1] 方程 3.3)。

pvalue 浮點數

在原假設下達到檢驗統計量極值的概率。

注意

讓:

是一個獨立的隨機變量

並令k1k2分別為 的觀測值。然後 poisson_means_test 分別使用大小為 n1n2 的樣本中觀察到的事件數量 k1k2 來檢驗原假設:

E-test 的一個好處是它對於小樣本量具有良好的能力,這可以降低采樣成本 [1]。經過評估並確定它比類似的C-test(有時稱為泊鬆精確測試)更強大。

參考

[1] (1,2)

克裏希納莫西,K.,和湯姆森,J. (2004)。用於比較兩個泊鬆均值的更強大的測試。統計規劃與推斷雜誌,119(1), 23-35。

[2]

Przyborowski, J. 和 Wilenski, H. (1940)。泊鬆級數測試樣品結果的均勻性:應用於測試菟絲子的三葉草種子。生物計量學,31(3/4), 313-323。

例子

假設一名園丁希望測試從種子公司購買的一袋三葉草種子中菟絲子(雜草)種子的數量。先前已確定三葉草中菟絲子種子的數量遵循泊鬆分布。

在運送給園丁之前,從麻袋中取出 100 克樣品。經分析,樣品中不含菟絲子種子;那是,k1是 0。然而,到達後,園丁從麻袋中又抽取了 100 克樣品。這次,樣本中發現了三顆菟絲子種子;那是,k2是 3。園丁想知道差異是否顯著,而不是偶然造成的。原假設是兩個樣本之間的差異僅僅是由於偶然,或者\(\lambda_1 - \lambda_2 = \mathtt{diff}\) 其中\(\mathtt{diff} = 0\) 。另一種假設是差異不是偶然造成的,或者\(\lambda_1 - \lambda_2 \ne 0\) 。園丁選擇 5% 的顯著性水平來拒絕零假設,轉而支持替代假設[2].

>>> import scipy.stats as stats
>>> res = stats.poisson_means_test(0, 100, 3, 100)
>>> res.statistic, res.pvalue
(-1.7320508075688772, 0.08837900929018157)

p 值為 0.088,表明在原假設下觀察到檢驗統計量值的可能性接近 9%。這超過了 5%,因此園丁不會拒絕原假設,因為在此水平上差異不能被視為顯著。

相關用法


注:本文由純淨天空篩選整理自scipy.org大神的英文原創作品 scipy.stats.poisson_means_test。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。