當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R nclass 計算直方圖的類數


R語言 nclass 位於 grDevices 包(package)。

說明

計算直方圖的類數,特別是 hist()

用法

nclass.Sturges(x)
nclass.scott(x)
nclass.FD(x, digits = 5)

參數

x

一個數據向量。

digits

IQR 計算之前舍入 x 時要保留的有效位數;請參閱下麵的“詳細信息”。

細節

nclass.Sturges 使用 Sturges 公式,隱式地將 bin 大小基於數據範圍。

nclass.scott 使用 Scott 根據標準誤差估計選擇的正態分布,除非它返回 1 時為零。

nclass.FD 使用基於 inter-quartile 範圍 ( IQR(signif(x, digits)) ) 的 Freedman-Diaconis 選擇,除非在使用越來越極端的對稱分位數直至 c(1,511)/512 時該值為零,並且如果該差異仍然為零,則恢複為使用斯科特的選擇。默認值digits = 5是經過幾次實驗後選擇的,但對於某些情況可能太低,請參閱PR#17274

建議的類數。

例子

set.seed(1)
x <- stats::rnorm(1111)
nclass.Sturges(x)

## Compare them:
NC <- function(x) c(Sturges = nclass.Sturges(x),
      Scott = nclass.scott(x), FD = nclass.FD(x))
NC(x)
onePt <- rep(1, 11)
NC(onePt) # no longer gives NaN

參考

Venables, W. N. and Ripley, B. D. (2002) Modern Applied Statistics with S-PLUS. Springer, page 112.

Freedman, D. and Diaconis, P. (1981). On the histogram as a density estimator: theory. Zeitschrift für Wahrscheinlichkeitstheorie und verwandte Gebiete, 57, 453-476. doi:10.1007/BF01025868.

Scott, D. W. (1979). On optimal and data-based histograms. Biometrika, 66, 605-610. doi:10.2307/2335182.

Scott, D. W. (1992) Multivariate Density Estimation. Theory, Practice, and Visualization. Wiley.

Sturges, H. A. (1926). The choice of a class interval. Journal of the American Statistical Association, 21, 65-66. doi:10.1080/01621459.1926.10502161.

也可以看看

histtruehist(包 MASS ); dpih(包 KernSmooth )用於 Wand(1995)提出的插件帶寬。

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Compute the Number of Classes for a Histogram。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。