empinf
位于 boot
包(package)。 说明
此函数计算应用于数据集的统计量的经验影响值。它允许四种类型的计算,即无穷小折刀(使用数值微分)、通常的折刀估计、‘positive’折刀估计以及使用统计量的引导复制回归来估计经验影响值的方法。所有方法均可用于一个或多个样品。
用法
empinf(boot.out = NULL, data = NULL, statistic = NULL,
type = NULL, stype = NULL ,index = 1, t = NULL,
strata = rep(1, n), eps = 0.001, ...)
参数
boot.out |
由函数 |
data |
包含需要经验影响值的数据的向量、矩阵或 DataFrame 。如果未提供 |
statistic |
需要经验影响值的统计数据。它必须是至少两个参数的函数,即数据集和权重、频率或指数的向量。第二个参数的性质由 |
type |
用于经验影响值的计算类型。可能的值 |
stype |
一个字符变量,赋予 |
index |
一个整数,给出 |
t |
长度为 |
strata |
指定多样本问题的层的整数向量或因子。如果提供 |
eps |
仅当 |
... |
|
细节
如果type
是"inf"
,则使用数值微分来近似经验影响值。这仅对于以加权形式写入的统计数据有意义(即 stype
是 "w"
)。如果type
是"jack"
,则返回经验影响的通常留一折刀估计。如果type
是"pos"
,则使用正(include-one-twice) 折刀值。如果type
是"reg"
,则必须提供引导对象。然后,回归方法通过在衍生它们的频率数组上回归 statistic
的引导复制来工作。自举频率数组是通过调用 boot.array
获得的。这些方法的更多细节在 Davison 和 Hinkley (1997) 的 2.7 节中给出。
经验影响值经常在非参数引导应用程序中使用。因此,许多其他函数在需要时调用empinf
。它们的一些使用示例包括方差的非参数 delta 估计、BCa 区间以及查找统计数据的线性近似以用作控制变量。它们还用于对立引导重采样。
值
应用于 data
的 statistic
经验影响值的向量。这些值的顺序与数据中观察值的顺序相同。
警告
empinf
的所有参数都必须使用 name =
value
约定传递。如果不遵循这一点,则可能会发生不可预测的错误。
例子
# The empirical influence values for the ratio of means in
# the city data.
ratio <- function(d, w) sum(d$x *w)/sum(d$u*w)
empinf(data = city, statistic = ratio)
city.boot <- boot(city, ratio, 499, stype="w")
empinf(boot.out = city.boot, type = "reg")
# A statistic that may be of interest in the difference of means
# problem is the t-statistic for testing equality of means. In
# the bootstrap we get replicates of the difference of means and
# the variance of that statistic and then want to use this output
# to get the empirical influence values of the t-statistic.
grav1 <- gravity[as.numeric(gravity[,2]) >= 7,]
grav.fun <- function(dat, w) {
strata <- tapply(dat[, 2], as.numeric(dat[, 2]))
d <- dat[, 1]
ns <- tabulate(strata)
w <- w/tapply(w, strata, sum)[strata]
mns <- as.vector(tapply(d * w, strata, sum)) # drop names
mn2 <- tapply(d * d * w, strata, sum)
s2hat <- sum((mn2 - mns^2)/ns)
c(mns[2] - mns[1], s2hat)
}
grav.boot <- boot(grav1, grav.fun, R = 499, stype = "w",
strata = grav1[, 2])
# Since the statistic of interest is a function of the bootstrap
# statistics, we must calculate the bootstrap replicates and pass
# them to empinf using the t argument.
grav.z <- (grav.boot$t[,1]-grav.boot$t0[1])/sqrt(grav.boot$t[,2])
empinf(boot.out = grav.boot, t = grav.z)
参考
Davison, A.C. and Hinkley, D.V. (1997) Bootstrap Methods and Their Application. Cambridge University Press.
Efron, B. (1982) The Jackknife, the Bootstrap and Other Resampling Plans. CBMS-NSF Regional Conference Series in Applied Mathematics, 38, SIAM.
Fernholtz, L.T. (1983) von Mises Calculus for Statistical Functionals. Lecture Notes in Statistics, 19, Springer-Verlag.
也可以看看
boot
, boot.array
, boot.ci
, control
, jack.after.boot
, linear.approx
, var.linear
相关用法
- R envelope 曲线的置信区间
- R exp.tilt 指数倾斜
- R poisons 动物生存时间
- R ducks 杂交鸭的行为和羽毛特征
- R nodal 前列腺癌的淋巴结受累
- R cloth 布料瑕疵数量
- R polar 新喀里多尼亚红土的极点位置
- R capability 模拟制造过程数据
- R beaver 海狸体温数据
- R saddle.distn Bootstrap 统计的鞍点分布近似
- R tsboot 时间序列的引导
- R logit 比例的逻辑
- R EEF.profile 经验可能性
- R tau Tau 粒子衰变模式
- R gravity 重力加速度
- R boot 引导重采样
- R plot.boot Bootstrap 模拟的输出图
- R boot.ci 非参数引导置信区间
- R tilt.boot 非参数倾斜引导
- R bigcity 美国城市人口
- R co.transfer 一氧化碳转移
- R imp.weights 重要性采样权重
- R acme 每月超额返回
- R glm.diag.plots 广义线性模型的诊断图
- R survival 辐射剂量后大鼠的存活率
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Empirical Influence Values。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。