當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


R bkde 計算分箱核密度估計

R語言 bkde 位於 KernSmooth 包(package)。

說明

返回數據概率密度的分箱核密度估計的 x 和 y 坐標。

用法

bkde(x, kernel = "normal", canonical = FALSE, bandwidth,
     gridsize = 401L, range.x, truncate = TRUE)

參數

x

要估計其密度的分布的觀測值的數值向量。不允許存在缺失值。

bandwidth

內核帶寬平滑參數。 bandwidth 的值越大,估計就越平滑,bandwidth 的值越小,估計就越不平滑。默認值是根據 x 的方差計算的帶寬,特別是 Wand 和 Jones 的“過度平滑帶寬選擇器”(1995 年,第 61 頁)。

kernel

決定平滑核的字符串。 kernel 可以是: "normal" - 高斯密度函數(默認)。 "box" - 一個矩形框。 "epanech" - 中心 beta(2,2) 密度。 "biweight" - 中心 beta(3,3) 密度。 "triweight" - 中心 beta(4,4) 密度。這可以縮寫為任何獨特的縮寫。

canonical

長度為一的邏輯向量:如果 TRUE ,則使用規範縮放的內核。

gridsize

用於估計密度的等距點的數量。

range.x

包含用於計算估計值的 x 的最小值和最大值的向量。默認值是最小和最大數據值,通過內核的支持進行擴展。

truncate

邏輯標誌:如果TRUE,則x值超出range.x指定範圍的數據將被忽略。

細節

這是普通核密度估計的分箱近似值。線性分箱用於獲取分箱計數。對於示例中的每個 x 值,內核以 x 為中心,並對每個數據點處的內核高度進行求和。經過標準化後,該總和就是輸出中相應的 y 值。

包含以下組件的列表:

x

計算估計值的排序 x 值的向量。

y

相應 x 處的密度估計向量。

背景

密度估計是一種平滑操作。不可避免地在估計偏差和估計變異性之間存在權衡:大帶寬將產生平滑的估計,這可能會隱藏密度的局部特征;小帶寬可能會給估計帶來虛假的波動。

例子

data(geyser, package="MASS")
x <- geyser$duration
est <- bkde(x, bandwidth=0.25)
plot(est, type="l")

參考

Wand, M. P. and Jones, M. C. (1995). Kernel Smoothing. Chapman and Hall, London.

也可以看看

densitydpikhistksmooth

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Compute a Binned Kernel Density Estimate。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。