當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


R dpill 選擇局部線性回歸的帶寬

R語言 dpill 位於 KernSmooth 包(package)。

說明

使用直接插件方法來選擇局部線性高斯核回歸估計的帶寬,如 Ruppert、Sheather 和 Wand (1995) 所說明的。

用法

dpill(x, y, blockmax = 5, divisor = 20, trim = 0.01, proptrun = 0.05, 
      gridsize = 401L, range.x, truncate = TRUE)

參數

x

x 數據的數值向量。不接受缺失值。

y

y 數據的數值向量。該長度必須與 x 相同,並且不接受缺失值。

blockmax

用於構建初始參數估計的數據塊的最大數量。

divisor

樣本大小除以的值,以確定用於構建初始參數估計的數據塊數量的下限。

trim

在應用插件方法之前,從 x 方向各端修剪的樣本比例。

proptrun

在函數估計中,x 的範圍在每一端被截斷的比例。

gridsize

要估計函數的等距網格點的數量。

range.x

包含用於計算估計值的 x 的最小值和最大值的向量。對於密度估計,默認值是最小和最大數據值,並在每一端添加範圍的 5%。對於回歸估計,默認值是最小和最大數據值。

truncate

邏輯標誌:如果TRUE,則x值超出range.x指定範圍的數據將被忽略。

細節

使用直接插件方法,其中出現在漸近最優帶寬表達式中的未知函數被核估計替換。內核是標準正態密度。數據塊上的最小二乘四次擬合用於獲得初始估計。 Mallow的 用於選擇塊的數量。

所選帶寬。

警告

如果 x 值中存在嚴重的不規則性(即離群值、稀疏區域),則帶寬選擇算法所需的局部多項式平滑可能會退化,並且函數將崩潰。 y方向的異常值可能會導致所選帶寬的質量惡化。

例子

data(geyser, package = "MASS")
x <- geyser$duration
y <- geyser$waiting
plot(x, y)
h <- dpill(x, y)
fit <- locpoly(x, y, bandwidth = h)
lines(fit)

參考

Ruppert, D., Sheather, S. J. and Wand, M. P. (1995). An effective bandwidth selector for local least squares regression. Journal of the American Statistical Association, 90, 1257-1270.

Wand, M. P. and Jones, M. C. (1995). Kernel Smoothing. Chapman and Hall, London.

也可以看看

ksmoothlocpoly

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Select a Bandwidth for Local Linear Regression。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。