saddle.distn
位於 boot
包(package)。 說明
使用鞍點方法近似整個分布。該函數可以計算感興趣的單變量量的簡單條件鞍點分布近似值。對於簡單鞍點,感興趣的量是 W 的線性組合,其中 W 是隨機變量向量。對於條件鞍點,我們需要給定任意數量的其他線性組合的值,得到一個線性組合的分布。 W 的分布必須是多項式、泊鬆分布或二元分布之一。此函數的主要用途是使用鞍點近似計算引導分布的分位數。函數 control
需要這樣的分位數來近似統計量的線性近似分布。
用法
saddle.distn(A, u = NULL, alpha = NULL, wdist = "m",
type = "simp", npts = 20, t = NULL, t0 = NULL,
init = rep(0.1, d), mu = rep(0.5, n), LR = FALSE,
strata = NULL, ...)
參數
A |
這是已知係數的矩陣或返回此類矩陣的函數。如果是函數,則其第一個參數必須是需要鞍點的點 |
u |
如果 |
alpha |
應返回的分布分位數的 alpha 水平。默認情況下,計算 0.1、0.5、1、2.5、5、10、20、50、80、90、95、97.5、99、99.5 和 99.9 百分位數。 |
wdist |
W 的分布。可能的值為 |
type |
要使用的鞍點類型。可能的值為 |
npts |
應計算鞍點近似值然後用於擬合樣條線的點數。 |
t |
計算鞍點近似值的點向量。這些點應超出所需的極端分位數,但仍處於引導分布的可能範圍內。統計量的觀測值不應包含在 |
t0 |
如果未提供 |
init |
當 |
mu |
分布的參數值向量。默認情況下 W 的分量是同分布的。 |
LR |
一個邏輯標誌。當 |
strata |
當 A 的行與分層數據相關時給出分層的向量。僅當 |
... |
當 |
細節
使用鞍點的範圍使得端點處的 cdf 近似比 alpha
的極值所需的更極端。通過評估 t0[1]-2*t0[2]
、 t0[1]-4*t0[2]
、 t0[1]-8*t0[2]
等點處的鞍點來找到下端點,直到找到 cdf 近似小於 min(alpha)/10
的點,然後使用二分法找到端點其 cdf 近似值在範圍( min(alpha)/1000
、 min(alpha)/10
)內。然後在下端點和 t0[1]
之間選擇許多等距的點,直到完成總共 npts/2
近似。以類似的方式將剩餘的npts/2
點選擇在t0[1]
的右側。任何非常接近分布中心的點都會被忽略,因為 cdf 近似在中心不可靠。然後將平滑樣條擬合到剩餘點處的鞍點分布函數近似的概率,並根據樣條預測所需的分位數。
有時該函數會終止並顯示消息 "Unable to find range"
。出現這種情況的主要原因有兩個。一是分布過於離散和/或所需的分位數過於極端,這可能導致函數無法在允許範圍內找到超出極端分位數的點。另一種可能性是 t0[2]
的值太小,因此需要太多步驟才能找到範圍。第一個問題隻能通過要求不太極端的分位數來解決,盡管對於非常離散的分布,近似值可能不是很好。在第二種情況下,使用較大的 t0[2]
值通常可以解決問題。
值
返回的值是類 "saddle.distn"
的對象。有關此類對象的說明,請參閱 saddle.distn.object
的幫助文件。
例子
# The bootstrap distribution of the mean of the air-conditioning
# failure data: fails to find value on R (and probably on S too)
air.t0 <- c(mean(aircondit$hours), sqrt(var(aircondit$hours)/12))
## Not run: saddle.distn(A = aircondit$hours/12, t0 = air.t0)
# alternatively using the conditional poisson
saddle.distn(A = cbind(aircondit$hours/12, 1), u = 12, wdist = "p",
type = "cond", t0 = air.t0)
# Distribution of the ratio of a sample of size 10 from the bigcity
# data, taken from Example 9.16 of Davison and Hinkley (1997).
ratio <- function(d, w) sum(d$x *w)/sum(d$u * w)
city.v <- var.linear(empinf(data = city, statistic = ratio))
bigcity.t0 <- c(mean(bigcity$x)/mean(bigcity$u), sqrt(city.v))
Afn <- function(t, data) cbind(data$x - t*data$u, 1)
ufn <- function(t, data) c(0,10)
saddle.distn(A = Afn, u = ufn, wdist = "b", type = "cond",
t0 = bigcity.t0, data = bigcity)
# From Example 9.16 of Davison and Hinkley (1997) again, we find the
# conditional distribution of the ratio given the sum of city$u.
Afn <- function(t, data) cbind(data$x-t*data$u, data$u, 1)
ufn <- function(t, data) c(0, sum(data$u), 10)
city.t0 <- c(mean(city$x)/mean(city$u), sqrt(city.v))
saddle.distn(A = Afn, u = ufn, wdist = "p", type = "cond", t0 = city.t0,
data = city)
參考
Booth, J.G. and Butler, R.W. (1990) Randomization distributions and saddlepoint approximations in generalized linear models. Biometrika, 77, 787-796.
Canty, A.J. and Davison, A.C. (1997) Implementation of saddlepoint approximations to resampling distributions. Computing Science and Statistics; Proceedings of the 28th Symposium on the Interface 248-253.
Davison, A.C. and Hinkley, D.V. (1997) Bootstrap Methods and their Application. Cambridge University Press.
Jensen, J.L. (1995) Saddlepoint Approximations. Oxford University Press.
也可以看看
lines.saddle.distn
, saddle
, saddle.distn.object
, smooth.spline
相關用法
- R saddle Bootstrap 統計的鞍點近似
- R salinity 水鹽度和河流排放
- R survival 輻射劑量後大鼠的存活率
- R simplex 線性規劃問題的單純形法
- R smooth.f 數據點上的平滑分布
- R poisons 動物生存時間
- R ducks 雜交鴨的行為和羽毛特征
- R nodal 前列腺癌的淋巴結受累
- R cloth 布料瑕疵數量
- R polar 新喀裏多尼亞紅土的極點位置
- R capability 模擬製造過程數據
- R beaver 海狸體溫數據
- R tsboot 時間序列的引導
- R logit 比例的邏輯
- R EEF.profile 經驗可能性
- R tau Tau 粒子衰變模式
- R gravity 重力加速度
- R boot 引導重采樣
- R plot.boot Bootstrap 模擬的輸出圖
- R boot.ci 非參數引導置信區間
- R tilt.boot 非參數傾斜引導
- R envelope 曲線的置信區間
- R bigcity 美國城市人口
- R co.transfer 一氧化碳轉移
- R imp.weights 重要性采樣權重
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Saddlepoint Distribution Approximations for Bootstrap Statistics。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。