當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python SciPy stats.kurtosis用法及代碼示例


本文簡要介紹 python 語言中 scipy.stats.kurtosis 的用法。

用法:

scipy.stats.kurtosis(a, axis=0, fisher=True, bias=True, nan_policy='propagate', *, keepdims=False)#

計算數據集的峰度(Fisher 或 Pearson)。

峰度是第四個中心矩除以方差的平方。如果使用 Fisher 的定義,則從結果中減去 3.0,得到正態分布的 0.0。

如果偏差為 False,則使用 k 統計量計算峰度以消除來自偏差矩估計器的偏差

使用 kurtosistest 查看結果是否足夠接近正常。

參數

a 數組

計算峰度的數據。

axis int 或無,默認值:0

如果是 int,則計算統計量的輸入軸。輸入的每個axis-slice(例如行)的統計信息將出現在輸出的相應元素中。如果 None ,輸入將在計算統計數據之前被分解。

fisher 布爾型,可選

如果為 True,則使用 Fisher 的定義(正常 ==> 0.0)。如果為 False,則使用 Pearson 的定義(正常 ==> 3.0)。

bias 布爾型,可選

如果為 False,則針對統計偏差校正計算。

nan_policy {‘propagate’, ‘omit’, ‘raise’}

定義如何處理輸入 NaN。

  • propagate :如果計算統計數據的軸切片(例如行)中存在NaN,則輸出的相應條目將為 NaN。

  • omit : 計算時將省略NaNs。如果計算統計數據的軸切片中剩餘的數據不足,則輸出的相應條目將為 NaN。

  • raise :如果存在 NaN,則會引發 ValueError

keepdims 布爾值,默認值:假

如果將其設置為 True,則縮小的軸將作為尺寸為 1 的尺寸留在結果中。使用此選項,結果將針對輸入數組正確廣播。

返回

kurtosis 數組

沿軸的值的峰度,返回 NaN,其中所有值都相等。

注意

從 SciPy 1.9 開始,np.matrix 輸入(不建議用於新代碼)在執行計算之前轉換為 np.ndarray。在這種情況下,輸出將是標量或適當形狀的 np.ndarray 而不是 2D np.matrix 。同樣,雖然屏蔽數組的屏蔽元素被忽略,但輸出將是標量或 np.ndarray 而不是帶有 mask=False 的屏蔽數組。

參考

[1]

Zwillinger, D. 和 Kokoska, S. (2000)。 CRC 標準概率和統計表和公式。查普曼和霍爾:紐約。 2000 年。

例子

在費舍爾的定義中,正態分布的峰度為零。在以下示例中,峰度接近於零,因為它是根據數據集計算的,而不是根據連續分布計算的。

>>> import numpy as np
>>> from scipy.stats import norm, kurtosis
>>> data = norm.rvs(size=1000, random_state=3)
>>> kurtosis(data)
-0.06928694200380558

具有較高峰度的分布具有較重的尾部。 Fisher 定義中正態分布的零值峰度可以作為參考點。

>>> import matplotlib.pyplot as plt
>>> import scipy.stats as stats
>>> from scipy.stats import kurtosis
>>> x = np.linspace(-5, 5, 100)
>>> ax = plt.subplot()
>>> distnames = ['laplace', 'norm', 'uniform']
>>> for distname in distnames:
...     if distname == 'uniform':
...         dist = getattr(stats, distname)(loc=-2, scale=4)
...     else:
...         dist = getattr(stats, distname)
...     data = dist.rvs(size=1000)
...     kur = kurtosis(data, fisher=True)
...     y = dist.pdf(x)
...     ax.plot(x, y, label="{}, {}".format(distname, round(kur, 3)))
...     ax.legend()

拉普拉斯分布的尾部比正態分布重。均勻分布(具有負峰度)的尾部最薄。

scipy-stats-kurtosis-1.png

相關用法


注:本文由純淨天空篩選整理自scipy.org大神的英文原創作品 scipy.stats.kurtosis。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。