當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python numpy nanquantile用法及代碼示例


本文簡要介紹 python 語言中 numpy.nanquantile 的用法。

用法:

numpy.nanquantile(a, q, axis=None, out=None, overwrite_input=False, method='linear', keepdims=<no value>, *, interpolation=None)

沿指定軸計算數據的第 q 個分位數,同時忽略 nan 值。返回數組元素的第 q 個分位數。

參數

a array_like

輸入數組或可轉換為數組的對象,包含要忽略的 nan 值

q 類似浮點數的數組

要計算的分位數或分位數序列,必須介於 0 和 1 之間。

axis {int,int 元組,無},可選

計算分位數的一個或多個軸。默認值是沿數組的扁平化版本計算分位數。

out ndarray,可選

用於放置結果的替代輸出數組。它必須具有與預期輸出相同的形狀和緩衝區長度,但如有必要,將強製轉換(輸出的)類型。

overwrite_input 布爾型,可選

如果為 True,則允許通過中間計算修改輸入數組 a,以節省內存。在這種情況下,該函數完成後輸入 a 的內容是未定義的。

method str,可選

此參數指定用於估計分位數的方法。有許多不同的方法,其中一些是 NumPy 獨有的。請參閱注釋以獲取解釋。 H&F; 論文 [1] 中總結的按 R 類型排序的選項為:

  1. ‘inverted_cdf’

  2. ‘averaged_inverted_cdf’

  3. ‘closest_observation’

  4. ‘interpolated_inverted_cdf’

  5. ‘hazen’

  6. ‘weibull’

  7. ‘linear’(默認)

  8. ‘median_unbiased’

  9. ‘normal_unbiased’

前三種方法是不連續的。 NumPy 進一步定義了默認 ‘linear’ (7.) 選項的以下不連續變體:

  • ‘lower’

  • ‘higher’,

  • ‘midpoint’

  • ‘nearest’

keepdims 布爾型,可選

如果將其設置為 True,則縮小的軸將作為尺寸為 1 的尺寸留在結果中。使用此選項,結果將針對原始數組 a 正確廣播。

如果這不是默認值,它將被傳遞(在空數組的特殊情況下)到numpy.mean底層數組的函數。如果數組是 sub-class 並且numpy.mean沒有kwarg保持昏暗這將引發運行時錯誤。

interpolation str,可選

方法關鍵字參數的已棄用名稱。

返回

quantile 標量或 ndarray

如果q是一個百分位數並且軸=無, 那麽結果是一個標量。如果給出多個分位數,則結果的第一個軸對應於分位數。其他軸是減少後剩餘的軸a.如果輸入包含整數或浮點數小於float64,輸出數據類型為float64.否則,輸出數據類型與輸入數據類型相同。如果out指定,則返回該數組。

注意

有關更多信息,請參閱 numpy.quantile

參考

1

R. J. Hyndman 和 Y. Fan,“統計包中的樣本分位數”,美國統計學家,50(4),第 361-365 頁,1996

例子

>>> a = np.array([[10., 7., 4.], [3., 2., 1.]])
>>> a[0][1] = np.nan
>>> a
array([[10.,  nan,   4.],
      [ 3.,   2.,   1.]])
>>> np.quantile(a, 0.5)
nan
>>> np.nanquantile(a, 0.5)
3.0
>>> np.nanquantile(a, 0.5, axis=0)
array([6.5, 2. , 2.5])
>>> np.nanquantile(a, 0.5, axis=1, keepdims=True)
array([[7.],
       [2.]])
>>> m = np.nanquantile(a, 0.5, axis=0)
>>> out = np.zeros_like(m)
>>> np.nanquantile(a, 0.5, axis=0, out=out)
array([6.5, 2. , 2.5])
>>> m
array([6.5,  2. ,  2.5])
>>> b = a.copy()
>>> np.nanquantile(b, 0.5, axis=1, overwrite_input=True)
array([7., 2.])
>>> assert not np.all(a==b)

相關用法


注:本文由純淨天空篩選整理自numpy.org大神的英文原創作品 numpy.nanquantile。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。