當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


R dpih 選擇直方圖箱寬度

R語言 dpih 位於 KernSmooth 包(package)。

說明

使用直接插件方法來選擇直方圖的箱寬。

用法

dpih(x, scalest = "minim", level = 2L, gridsize = 401L, 
     range.x = range(x), truncate = TRUE)

參數

x

包含要在其上構建直方圖的樣本的數值向量。

scalest

規模的估計。

"stdev" - 使用標準差。

使用 "iqr" - inter-quartile 範圍除以 1.349。

"minim" - 使用 "stdev""iqr" 中的最小值。

level

插件規則中使用的函數估計級別數。

gridsize

函數估計的分箱近似中使用的網格點的數量。

range.x

獲得函數估計的範圍。默認值是最小和最大數據值。

truncate

如果truncateTRUE,則忽略range.x 指定的間隔之外的觀察結果。否則,它們用於對極端網格點進行加權。

細節

使用直接插件方法,其中出現在漸近最優箱寬度和帶寬表達式中的未知函數被核估計替換。正態分布用於提供初始估計。

選定的 bin 寬度。

背景

Wand (1995) 中說明了這種選擇直方圖箱寬的方法。它是 Scott (1979) 正常尺度規則的擴展,並使用來自帶寬選擇的插件思想來進行核密度估計(例如 Sheather 和 Jones,1991)。

例子

data(geyser, package="MASS")
x <- geyser$duration
h <- dpih(x)
bins <- seq(min(x)-h, max(x)+h, by=h)
hist(x, breaks=bins)

參考

Scott, D. W. (1979). On optimal and data-based histograms. Biometrika, 66, 605-610.

Sheather, S. J. and Jones, M. C. (1991). A reliable data-based bandwidth selection method for kernel density estimation. Journal of the Royal Statistical Society, Series B, 53, 683-690.

Wand, M. P. (1995). Data-based choice of histogram binwidth. The American Statistician, 51, 59-64.

也可以看看

hist

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Select a Histogram Bin Width。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。