saddle.distn
位于 boot
包(package)。 说明
使用鞍点方法近似整个分布。该函数可以计算感兴趣的单变量量的简单条件鞍点分布近似值。对于简单鞍点,感兴趣的量是 W 的线性组合,其中 W 是随机变量向量。对于条件鞍点,我们需要给定任意数量的其他线性组合的值,得到一个线性组合的分布。 W 的分布必须是多项式、泊松分布或二元分布之一。此函数的主要用途是使用鞍点近似计算引导分布的分位数。函数 control
需要这样的分位数来近似统计量的线性近似分布。
用法
saddle.distn(A, u = NULL, alpha = NULL, wdist = "m",
type = "simp", npts = 20, t = NULL, t0 = NULL,
init = rep(0.1, d), mu = rep(0.5, n), LR = FALSE,
strata = NULL, ...)
参数
A |
这是已知系数的矩阵或返回此类矩阵的函数。如果是函数,则其第一个参数必须是需要鞍点的点 |
u |
如果 |
alpha |
应返回的分布分位数的 alpha 水平。默认情况下,计算 0.1、0.5、1、2.5、5、10、20、50、80、90、95、97.5、99、99.5 和 99.9 百分位数。 |
wdist |
W 的分布。可能的值为 |
type |
要使用的鞍点类型。可能的值为 |
npts |
应计算鞍点近似值然后用于拟合样条线的点数。 |
t |
计算鞍点近似值的点向量。这些点应超出所需的极端分位数,但仍处于引导分布的可能范围内。统计量的观测值不应包含在 |
t0 |
如果未提供 |
init |
当 |
mu |
分布的参数值向量。默认情况下 W 的分量是同分布的。 |
LR |
一个逻辑标志。当 |
strata |
当 A 的行与分层数据相关时给出分层的向量。仅当 |
... |
当 |
细节
使用鞍点的范围使得端点处的 cdf 近似比 alpha
的极值所需的更极端。通过评估 t0[1]-2*t0[2]
、 t0[1]-4*t0[2]
、 t0[1]-8*t0[2]
等点处的鞍点来找到下端点,直到找到 cdf 近似小于 min(alpha)/10
的点,然后使用二分法找到端点其 cdf 近似值在范围( min(alpha)/1000
、 min(alpha)/10
)内。然后在下端点和 t0[1]
之间选择许多等距的点,直到完成总共 npts/2
近似。以类似的方式将剩余的npts/2
点选择在t0[1]
的右侧。任何非常接近分布中心的点都会被忽略,因为 cdf 近似在中心不可靠。然后将平滑样条拟合到剩余点处的鞍点分布函数近似的概率,并根据样条预测所需的分位数。
有时该函数会终止并显示消息 "Unable to find range"
。出现这种情况的主要原因有两个。一是分布过于离散和/或所需的分位数过于极端,这可能导致函数无法在允许范围内找到超出极端分位数的点。另一种可能性是 t0[2]
的值太小,因此需要太多步骤才能找到范围。第一个问题只能通过要求不太极端的分位数来解决,尽管对于非常离散的分布,近似值可能不是很好。在第二种情况下,使用较大的 t0[2]
值通常可以解决问题。
值
返回的值是类 "saddle.distn"
的对象。有关此类对象的说明,请参阅 saddle.distn.object
的帮助文件。
例子
# The bootstrap distribution of the mean of the air-conditioning
# failure data: fails to find value on R (and probably on S too)
air.t0 <- c(mean(aircondit$hours), sqrt(var(aircondit$hours)/12))
## Not run: saddle.distn(A = aircondit$hours/12, t0 = air.t0)
# alternatively using the conditional poisson
saddle.distn(A = cbind(aircondit$hours/12, 1), u = 12, wdist = "p",
type = "cond", t0 = air.t0)
# Distribution of the ratio of a sample of size 10 from the bigcity
# data, taken from Example 9.16 of Davison and Hinkley (1997).
ratio <- function(d, w) sum(d$x *w)/sum(d$u * w)
city.v <- var.linear(empinf(data = city, statistic = ratio))
bigcity.t0 <- c(mean(bigcity$x)/mean(bigcity$u), sqrt(city.v))
Afn <- function(t, data) cbind(data$x - t*data$u, 1)
ufn <- function(t, data) c(0,10)
saddle.distn(A = Afn, u = ufn, wdist = "b", type = "cond",
t0 = bigcity.t0, data = bigcity)
# From Example 9.16 of Davison and Hinkley (1997) again, we find the
# conditional distribution of the ratio given the sum of city$u.
Afn <- function(t, data) cbind(data$x-t*data$u, data$u, 1)
ufn <- function(t, data) c(0, sum(data$u), 10)
city.t0 <- c(mean(city$x)/mean(city$u), sqrt(city.v))
saddle.distn(A = Afn, u = ufn, wdist = "p", type = "cond", t0 = city.t0,
data = city)
参考
Booth, J.G. and Butler, R.W. (1990) Randomization distributions and saddlepoint approximations in generalized linear models. Biometrika, 77, 787-796.
Canty, A.J. and Davison, A.C. (1997) Implementation of saddlepoint approximations to resampling distributions. Computing Science and Statistics; Proceedings of the 28th Symposium on the Interface 248-253.
Davison, A.C. and Hinkley, D.V. (1997) Bootstrap Methods and their Application. Cambridge University Press.
Jensen, J.L. (1995) Saddlepoint Approximations. Oxford University Press.
也可以看看
lines.saddle.distn
, saddle
, saddle.distn.object
, smooth.spline
相关用法
- R saddle Bootstrap 统计的鞍点近似
- R salinity 水盐度和河流排放
- R survival 辐射剂量后大鼠的存活率
- R simplex 线性规划问题的单纯形法
- R smooth.f 数据点上的平滑分布
- R poisons 动物生存时间
- R ducks 杂交鸭的行为和羽毛特征
- R nodal 前列腺癌的淋巴结受累
- R cloth 布料瑕疵数量
- R polar 新喀里多尼亚红土的极点位置
- R capability 模拟制造过程数据
- R beaver 海狸体温数据
- R tsboot 时间序列的引导
- R logit 比例的逻辑
- R EEF.profile 经验可能性
- R tau Tau 粒子衰变模式
- R gravity 重力加速度
- R boot 引导重采样
- R plot.boot Bootstrap 模拟的输出图
- R boot.ci 非参数引导置信区间
- R tilt.boot 非参数倾斜引导
- R envelope 曲线的置信区间
- R bigcity 美国城市人口
- R co.transfer 一氧化碳转移
- R imp.weights 重要性采样权重
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Saddlepoint Distribution Approximations for Bootstrap Statistics。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。