用法:
dask.array.stats.f_oneway(*args)
執行one-way ANOVA。
此DocString從scipy.statsf_oneway複製。
可能存在與 Dask 版本的一些不一致之處。
one-way ANOVA 檢驗兩個或多個組具有相同總體均值的原假設。該測試適用於來自兩組或更多組的樣本,可能具有不同的大小。
- sample1, sample2, …:array_like
每組的樣本測量值。必須至少有兩個參數。如果數組是多維的,那麽除了
axis
之外,數組的所有維度都必須相同。- axis:int 可選(Dask 不支持)
沿其應用測試的輸入數組的軸。默認值為 0。
- statistic:浮點數
測試的計算 F 統計量。
- pvalue:浮點數
來自 F 分布的關聯 p-value。
- F_onewayConstantInputWarning
如果每個輸入數組都是常量數組,則引發。在這種情況下,F 統計量是無限的或未定義,因此返回
np.inf
或np.nan
。- F_onewayBadInputSizesWarning
如果任何輸入數組的長度為 0,或者所有輸入數組的長度為 1,則引發。在這些情況下,為 F 統計和 p-value 返回
np.nan
。
參數:
返回:
警告:
注意:
ANOVA 檢驗具有重要的假設,必須滿足這些假設才能使關聯的p-value 有效。
樣本是獨立的。
每個樣本來自一個正態分布的總體。
各組的總體標準差均相等。此屬性稱為同方差性。
如果這些假設對於給定的一組數據不成立,則仍然可以使用 Kruskal-Wallis H-test (
scipy.stats.kruskal
) 或 Alexander-Govern 測試 (scipy.stats.alexandergovern
),盡管會損失一些功率。每組的長度必須至少為 1,並且必須至少有一組長度大於 1。如果不滿足這些條件,則會生成警告並返回 (
np.nan
,np.nan
)。如果每個組包含常量值,並且至少存在兩個具有不同值的組,則該函數會生成警告並返回 (
np.inf
, 0)。如果所有組中的所有值都相同,則函數會生成警告並返回(
np.nan
、np.nan
)。該算法來自 Heiman [2],pp.394-7。
參考:
- 1
R. Lowry,“推理統計的概念和應用”,第 14 章,2014 年,http://vassarstats.net/textbook/
- 2
G.W.海曼,“理解研究方法和統計:心理學綜合介紹”,霍頓、米夫林和公司,2001 年。
- 3
G.H. McDonald《生物統計手冊》,One-way方差分析。 http://www.biostathandbook.com/onewayanova.html
例子:
>>> from scipy.stats import f_oneway
這裏有一些數據[3],來自五個地點的貽貝貽 Shell 測量(前內收肌疤痕的長度,通過除以長度標準化):俄勒岡州蒂拉穆克;俄勒岡州紐波特;阿拉斯加州聖彼得堡;俄羅斯馬加丹;和芬蘭的 Tvarminne,取自 McDonald 等人使用的更大的數據集。 (1991)。
>>> tillamook = [0.0571, 0.0813, 0.0831, 0.0976, 0.0817, 0.0859, 0.0735, ... 0.0659, 0.0923, 0.0836] >>> newport = [0.0873, 0.0662, 0.0672, 0.0819, 0.0749, 0.0649, 0.0835, ... 0.0725] >>> petersburg = [0.0974, 0.1352, 0.0817, 0.1016, 0.0968, 0.1064, 0.105] >>> magadan = [0.1033, 0.0915, 0.0781, 0.0685, 0.0677, 0.0697, 0.0764, ... 0.0689] >>> tvarminne = [0.0703, 0.1026, 0.0956, 0.0973, 0.1039, 0.1045] >>> f_oneway(tillamook, newport, petersburg, magadan, tvarminne) F_onewayResult(statistic=7.121019471642447, pvalue=0.0002812242314534544)
f_oneway
接受多維輸入數組。當輸入為多維且未給出axis
時,將沿輸入數組的第一個軸執行測試。對於以下數據,進行3次測試,每列一次。>>> a = np.array([[9.87, 9.03, 6.81], ... [7.18, 8.35, 7.00], ... [8.39, 7.58, 7.68], ... [7.45, 6.33, 9.35], ... [6.41, 7.10, 9.33], ... [8.00, 8.24, 8.44]]) >>> b = np.array([[6.35, 7.30, 7.16], ... [6.65, 6.68, 7.63], ... [5.72, 7.73, 6.72], ... [7.01, 9.19, 7.41], ... [7.75, 7.87, 8.30], ... [6.90, 7.97, 6.97]]) >>> c = np.array([[3.31, 8.77, 1.01], ... [8.25, 3.24, 3.62], ... [6.32, 8.81, 5.19], ... [7.48, 8.83, 8.91], ... [8.59, 6.01, 6.07], ... [3.07, 9.72, 7.48]]) >>> F, p = f_oneway(a, b, c) >>> F array([1.75676344, 0.03701228, 3.76439349]) >>> p array([0.20630784, 0.96375203, 0.04733157])
相關用法
- Python dask.array.stats.ttest_ind用法及代碼示例
- Python dask.array.stats.ttest_rel用法及代碼示例
- Python dask.array.stats.chisquare用法及代碼示例
- Python dask.array.stats.kurtosistest用法及代碼示例
- Python dask.array.stats.moment用法及代碼示例
- Python dask.array.stats.power_divergence用法及代碼示例
- Python dask.array.stats.kurtosis用法及代碼示例
- Python dask.array.stats.skew用法及代碼示例
- Python dask.array.stats.skewtest用法及代碼示例
- Python dask.array.stats.ttest_1samp用法及代碼示例
- Python dask.array.stats.normaltest用法及代碼示例
- Python dask.array.stack用法及代碼示例
- Python dask.array.store用法及代碼示例
- Python dask.array.std用法及代碼示例
- Python dask.array.square用法及代碼示例
- Python dask.array.sinc用法及代碼示例
- Python dask.array.searchsorted用法及代碼示例
- Python dask.array.sum用法及代碼示例
- Python dask.array.squeeze用法及代碼示例
- Python dask.array.signbit用法及代碼示例
注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.array.stats.f_oneway。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。