当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R bkde 计算分箱核密度估计


R语言 bkde 位于 KernSmooth 包(package)。

说明

返回数据概率密度的分箱核密度估计的 x 和 y 坐标。

用法

bkde(x, kernel = "normal", canonical = FALSE, bandwidth,
     gridsize = 401L, range.x, truncate = TRUE)

参数

x

要估计其密度的分布的观测值的数值向量。不允许存在缺失值。

bandwidth

内核带宽平滑参数。 bandwidth 的值越大,估计就越平滑,bandwidth 的值越小,估计就越不平滑。默认值是根据 x 的方差计算的带宽,特别是 Wand 和 Jones 的“过度平滑带宽选择器”(1995 年,第 61 页)。

kernel

决定平滑核的字符串。 kernel 可以是: "normal" - 高斯密度函数(默认)。 "box" - 一个矩形框。 "epanech" - 中心 beta(2,2) 密度。 "biweight" - 中心 beta(3,3) 密度。 "triweight" - 中心 beta(4,4) 密度。这可以缩写为任何独特的缩写。

canonical

长度为一的逻辑向量:如果 TRUE ,则使用规范缩放的内核。

gridsize

用于估计密度的等距点的数量。

range.x

包含用于计算估计值的 x 的最小值和最大值的向量。默认值是最小和最大数据值,通过内核的支持进行扩展。

truncate

逻辑标志:如果TRUE,则x值超出range.x指定范围的数据将被忽略。

细节

这是普通核密度估计的分箱近似值。线性分箱用于获取分箱计数。对于示例中的每个 x 值,内核以 x 为中心,并对每个数据点处的内核高度进行求和。经过标准化后,该总和就是输出中相应的 y 值。

包含以下组件的列表:

x

计算估计值的排序 x 值的向量。

y

相应 x 处的密度估计向量。

背景

密度估计是一种平滑操作。不可避免地在估计偏差和估计变异性之间存在权衡:大带宽将产生平滑的估计,这可能会隐藏密度的局部特征;小带宽可能会给估计带来虚假的波动。

例子

data(geyser, package="MASS")
x <- geyser$duration
est <- bkde(x, bandwidth=0.25)
plot(est, type="l")

参考

Wand, M. P. and Jones, M. C. (1995). Kernel Smoothing. Chapman and Hall, London.

也可以看看

densitydpikhistksmooth

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Compute a Binned Kernel Density Estimate。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。