当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R dpill 选择局部线性回归的带宽


R语言 dpill 位于 KernSmooth 包(package)。

说明

使用直接插件方法来选择局部线性高斯核回归估计的带宽,如 Ruppert、Sheather 和 Wand (1995) 所说明的。

用法

dpill(x, y, blockmax = 5, divisor = 20, trim = 0.01, proptrun = 0.05, 
      gridsize = 401L, range.x, truncate = TRUE)

参数

x

x 数据的数值向量。不接受缺失值。

y

y 数据的数值向量。该长度必须与 x 相同,并且不接受缺失值。

blockmax

用于构建初始参数估计的数据块的最大数量。

divisor

样本大小除以的值,以确定用于构建初始参数估计的数据块数量的下限。

trim

在应用插件方法之前,从 x 方向各端修剪的样本比例。

proptrun

在函数估计中,x 的范围在每一端被截断的比例。

gridsize

要估计函数的等距网格点的数量。

range.x

包含用于计算估计值的 x 的最小值和最大值的向量。对于密度估计,默认值是最小和最大数据值,并在每一端添加范围的 5%。对于回归估计,默认值是最小和最大数据值。

truncate

逻辑标志:如果TRUE,则x值超出range.x指定范围的数据将被忽略。

细节

使用直接插件方法,其中出现在渐近最优带宽表达式中的未知函数被核估计替换。内核是标准正态密度。数据块上的最小二乘四次拟合用于获得初始估计。 Mallow的 用于选择块的数量。

所选带宽。

警告

如果 x 值中存在严重的不规则性(即离群值、稀疏区域),则带宽选择算法所需的局部多项式平滑可能会退化,并且函数将崩溃。 y方向的异常值可能会导致所选带宽的质量恶化。

例子

data(geyser, package = "MASS")
x <- geyser$duration
y <- geyser$waiting
plot(x, y)
h <- dpill(x, y)
fit <- locpoly(x, y, bandwidth = h)
lines(fit)

参考

Ruppert, D., Sheather, S. J. and Wand, M. P. (1995). An effective bandwidth selector for local least squares regression. Journal of the American Statistical Association, 90, 1257-1270.

Wand, M. P. and Jones, M. C. (1995). Kernel Smoothing. Chapman and Hall, London.

也可以看看

ksmoothlocpoly

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Select a Bandwidth for Local Linear Regression。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。