當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python SciPy special.smirnov用法及代碼示例


本文簡要介紹 python 語言中 scipy.special.smirnov 的用法。

用法:

scipy.special.smirnov(n, d, out=None) = <ufunc 'smirnov'>#

Kolmogorov-Smirnov互補累積分布函數

返回 Dn+(或 Dn-)的精確 Kolmogorov-Smirnov 互補累積分布函數(也稱為生存函數),用於對經驗分布和理論分布之間的相等性進行單方麵檢驗。它等於理論分布與基於經驗的分布之間的最大差異的概率n樣本大於 d。

參數

n int

樣本數

d 浮點數 數組

經驗 CDF (ECDF) 和目標 CDF 之間的偏差。

out ndarray,可選

函數結果的可選輸出數組

返回

標量或 ndarray

smirnov(n, d) 的值,Prob(Dn+ >= d) (Also Prob(Dn- >= d))

注意

smirnov被使用stats.kstest在Kolmogorov-Smirnov 擬合優度檢驗的應用中。由於曆史原因,此函數在scpy.special,但實現最準確的 CDF/SF/PDF/PPF/ISF 計算的推薦方法是使用stats.ksone分配。

例子

>>> import numpy as np
>>> from scipy.special import smirnov
>>> from scipy.stats import norm

顯示大小為 5 的樣本中差距至少為 0、0.5 和 1.0 的概率。

>>> smirnov(5, [0, 0.5, 1.0])
array([ 1.   ,  0.056,  0.   ])

將大小為 5 的樣本與平均值 0、標準差 1 的標準正態分布 N(0, 1) 進行比較。

x 是樣本。

>>> x = np.array([-1.392, -0.135, 0.114, 0.190, 1.82])
>>> target = norm(0, 1)
>>> cdfs = target.cdf(x)
>>> cdfs
array([0.0819612 , 0.44630594, 0.5453811 , 0.57534543, 0.9656205 ])

構建經驗 CDF 和 K-S 統計數據(Dn+、Dn-、Dn)。

>>> n = len(x)
>>> ecdfs = np.arange(n+1, dtype=float)/n
>>> cols = np.column_stack([x, ecdfs[1:], cdfs, cdfs - ecdfs[:n],
...                        ecdfs[1:] - cdfs])
>>> with np.printoptions(precision=3):
...    print(cols)
[[-1.392  0.2    0.082  0.082  0.118]
 [-0.135  0.4    0.446  0.246 -0.046]
 [ 0.114  0.6    0.545  0.145  0.055]
 [ 0.19   0.8    0.575 -0.025  0.225]
 [ 1.82   1.     0.966  0.166  0.034]]
>>> gaps = cols[:, -2:]
>>> Dnpm = np.max(gaps, axis=0)
>>> print(f'Dn-={Dnpm[0]:f}, Dn+={Dnpm[1]:f}')
Dn-=0.246306, Dn+=0.224655
>>> probs = smirnov(n, Dnpm)
>>> print(f'For a sample of size {n} drawn from N(0, 1):',
...       f' Smirnov n={n}: Prob(Dn- >= {Dnpm[0]:f}) = {probs[0]:.4f}',
...       f' Smirnov n={n}: Prob(Dn+ >= {Dnpm[1]:f}) = {probs[1]:.4f}',
...       sep='\n')
For a sample of size 5 drawn from N(0, 1):
 Smirnov n=5: Prob(Dn- >= 0.246306) = 0.4711
 Smirnov n=5: Prob(Dn+ >= 0.224655) = 0.5245

繪製經驗 CDF 和標準正態 CDF。

>>> import matplotlib.pyplot as plt
>>> plt.step(np.concatenate(([-2.5], x, [2.5])),
...          np.concatenate((ecdfs, [1])),
...          where='post', label='Empirical CDF')
>>> xx = np.linspace(-2.5, 2.5, 100)
>>> plt.plot(xx, target.cdf(xx), '--', label='CDF for N(0, 1)')

添加標記 Dn+ 和 Dn- 的垂直線。

>>> iminus, iplus = np.argmax(gaps, axis=0)
>>> plt.vlines([x[iminus]], ecdfs[iminus], cdfs[iminus], color='r',
...            alpha=0.5, lw=4)
>>> plt.vlines([x[iplus]], cdfs[iplus], ecdfs[iplus+1], color='m',
...            alpha=0.5, lw=4)
>>> plt.grid(True)
>>> plt.legend(framealpha=1, shadow=True)
>>> plt.show()
scipy-special-smirnov-1.png

相關用法


注:本文由純淨天空篩選整理自scipy.org大神的英文原創作品 scipy.special.smirnov。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。