empinf
位於 boot
包(package)。 說明
此函數計算應用於數據集的統計量的經驗影響值。它允許四種類型的計算,即無窮小折刀(使用數值微分)、通常的折刀估計、‘positive’折刀估計以及使用統計量的引導複製回歸來估計經驗影響值的方法。所有方法均可用於一個或多個樣品。
用法
empinf(boot.out = NULL, data = NULL, statistic = NULL,
type = NULL, stype = NULL ,index = 1, t = NULL,
strata = rep(1, n), eps = 0.001, ...)
參數
boot.out |
由函數 |
data |
包含需要經驗影響值的數據的向量、矩陣或 DataFrame 。如果未提供 |
statistic |
需要經驗影響值的統計數據。它必須是至少兩個參數的函數,即數據集和權重、頻率或指數的向量。第二個參數的性質由 |
type |
用於經驗影響值的計算類型。可能的值 |
stype |
一個字符變量,賦予 |
index |
一個整數,給出 |
t |
長度為 |
strata |
指定多樣本問題的層的整數向量或因子。如果提供 |
eps |
僅當 |
... |
|
細節
如果type
是"inf"
,則使用數值微分來近似經驗影響值。這僅對於以加權形式寫入的統計數據有意義(即 stype
是 "w"
)。如果type
是"jack"
,則返回經驗影響的通常留一折刀估計。如果type
是"pos"
,則使用正(include-one-twice) 折刀值。如果type
是"reg"
,則必須提供引導對象。然後,回歸方法通過在衍生它們的頻率數組上回歸 statistic
的引導複製來工作。自舉頻率數組是通過調用 boot.array
獲得的。這些方法的更多細節在 Davison 和 Hinkley (1997) 的 2.7 節中給出。
經驗影響值經常在非參數引導應用程序中使用。因此,許多其他函數在需要時調用empinf
。它們的一些使用示例包括方差的非參數 delta 估計、BCa 區間以及查找統計數據的線性近似以用作控製變量。它們還用於對立引導重采樣。
值
應用於 data
的 statistic
經驗影響值的向量。這些值的順序與數據中觀察值的順序相同。
警告
empinf
的所有參數都必須使用 name =
value
約定傳遞。如果不遵循這一點,則可能會發生不可預測的錯誤。
例子
# The empirical influence values for the ratio of means in
# the city data.
ratio <- function(d, w) sum(d$x *w)/sum(d$u*w)
empinf(data = city, statistic = ratio)
city.boot <- boot(city, ratio, 499, stype="w")
empinf(boot.out = city.boot, type = "reg")
# A statistic that may be of interest in the difference of means
# problem is the t-statistic for testing equality of means. In
# the bootstrap we get replicates of the difference of means and
# the variance of that statistic and then want to use this output
# to get the empirical influence values of the t-statistic.
grav1 <- gravity[as.numeric(gravity[,2]) >= 7,]
grav.fun <- function(dat, w) {
strata <- tapply(dat[, 2], as.numeric(dat[, 2]))
d <- dat[, 1]
ns <- tabulate(strata)
w <- w/tapply(w, strata, sum)[strata]
mns <- as.vector(tapply(d * w, strata, sum)) # drop names
mn2 <- tapply(d * d * w, strata, sum)
s2hat <- sum((mn2 - mns^2)/ns)
c(mns[2] - mns[1], s2hat)
}
grav.boot <- boot(grav1, grav.fun, R = 499, stype = "w",
strata = grav1[, 2])
# Since the statistic of interest is a function of the bootstrap
# statistics, we must calculate the bootstrap replicates and pass
# them to empinf using the t argument.
grav.z <- (grav.boot$t[,1]-grav.boot$t0[1])/sqrt(grav.boot$t[,2])
empinf(boot.out = grav.boot, t = grav.z)
參考
Davison, A.C. and Hinkley, D.V. (1997) Bootstrap Methods and Their Application. Cambridge University Press.
Efron, B. (1982) The Jackknife, the Bootstrap and Other Resampling Plans. CBMS-NSF Regional Conference Series in Applied Mathematics, 38, SIAM.
Fernholtz, L.T. (1983) von Mises Calculus for Statistical Functionals. Lecture Notes in Statistics, 19, Springer-Verlag.
也可以看看
boot
, boot.array
, boot.ci
, control
, jack.after.boot
, linear.approx
, var.linear
相關用法
- R envelope 曲線的置信區間
- R exp.tilt 指數傾斜
- R poisons 動物生存時間
- R ducks 雜交鴨的行為和羽毛特征
- R nodal 前列腺癌的淋巴結受累
- R cloth 布料瑕疵數量
- R polar 新喀裏多尼亞紅土的極點位置
- R capability 模擬製造過程數據
- R beaver 海狸體溫數據
- R saddle.distn Bootstrap 統計的鞍點分布近似
- R tsboot 時間序列的引導
- R logit 比例的邏輯
- R EEF.profile 經驗可能性
- R tau Tau 粒子衰變模式
- R gravity 重力加速度
- R boot 引導重采樣
- R plot.boot Bootstrap 模擬的輸出圖
- R boot.ci 非參數引導置信區間
- R tilt.boot 非參數傾斜引導
- R bigcity 美國城市人口
- R co.transfer 一氧化碳轉移
- R imp.weights 重要性采樣權重
- R acme 每月超額返回
- R glm.diag.plots 廣義線性模型的診斷圖
- R survival 輻射劑量後大鼠的存活率
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Empirical Influence Values。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。