fitdistr
位於 MASS
包(package)。 說明
Maximum-likelihood 單變量分布擬合,如果需要,允許參數保持固定。
用法
fitdistr(x, densfun, start, ...)
參數
x |
長度至少為 1 且僅包含 finite 值的數值向量。 |
densfun |
字符串或返回在其第一個參數處計算的密度的函數。 分布 |
start |
給出要使用初始值優化的參數的命名列表。對於某些指定的發行版來說可以省略,而對於其他發行版則必須省略(請參閱詳細信息)。 |
... |
其他參數,適用於 |
細節
對於正態分布、log-Normal、幾何分布、指數分布和泊鬆分布,使用封閉形式 MLE(和精確標準誤差),並且不應提供start
。
對於所有其他分布,使用 optim
執行對數似然的直接優化。估計的標準誤差取自觀察到的信息矩陣,通過數值近似計算。對於一維問題,使用 Nelder-Mead 方法;對於多維問題,使用 BFGS 方法,除非提供了名為 lower
或 upper
的參數(當使用 L-BFGS-B
時)或顯式提供了 method
。
對於 "t"
命名分布,密度被視為具有位置 m
和尺度 s
的位置尺度族。
對於以下命名分布,如果省略 start
或僅部分指定,將計算合理的起始值: "cauchy"
、 "gamma"
、 "logistic"
、 "negative binomial"
(由 mu
和 size
參數化), "t"
和 "weibull"
。請注意,如果擬合較差,這些起始值可能不夠好:特別是它們不能抵抗異常值,除非擬合分布是長尾的。
類 "fitdistr"
有 print
、 coef
、 vcov
和 logLik
方法。
值
類 "fitdistr"
的對象,一個包含四個組件的列表,
estimate |
參數估計, |
sd |
估計的標準誤差, |
vcov |
估計的方差-協方差矩陣,以及 |
loglik |
對數似然。 |
注意
數值優化無法創造奇跡:請注意 optim
中有關縮放數據的注釋。如果擬合的參數遠離 1,請考慮指定控製參數 parscale
重新擬合。
例子
## avoid spurious accuracy
op <- options(digits = 3)
set.seed(123)
x <- rgamma(100, shape = 5, rate = 0.1)
fitdistr(x, "gamma")
## now do this directly with more control.
fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001)
set.seed(123)
x2 <- rt(250, df = 9)
fitdistr(x2, "t", df = 9)
## allow df to vary: not a very good idea!
fitdistr(x2, "t")
## now do fixed-df fit directly with more control.
mydt <- function(x, m, s, df) dt((x-m)/s, df)/s
fitdistr(x2, mydt, list(m = 0, s = 1), df = 9, lower = c(-Inf, 0))
set.seed(123)
x3 <- rweibull(100, shape = 4, scale = 100)
fitdistr(x3, "weibull")
set.seed(123)
x4 <- rnegbin(500, mu = 5, theta = 4)
fitdistr(x4, "Negative Binomial")
options(op)
參考
Venables, W. N. and Ripley, B. D. (2002) Modern Applied Statistics with S. Fourth edition. Springer.
相關用法
- R fractions 有理逼近
- R farms 農場管理中的生態因子
- R forbes 福布斯關於阿爾卑斯山沸點的數據
- R fgl 法醫玻璃碎片的測量
- R summary.rlm 魯棒線性模型的總結方法
- R ginv 廣義逆矩陣
- R housing 哥本哈根住房條件調查的頻率表
- R biopsy 乳腺癌患者的活檢數據
- R predict.qda 根據二次判別分析進行分類
- R contr.sdif 連續差異對比編碼
- R Melanoma 惡性黑色素瘤的生存率
- R boxcox 線性模型的 Box-Cox 變換
- R predict.glmmPQL glmmPQL 擬合的預測方法
- R ucv 帶寬選擇的無偏交叉驗證
- R theta.md 估計負二項式的 theta
- R parcoord 平行坐標圖
- R rlm 線性模型的穩健擬合
- R npk 經典 N、P、K 階乘實驗
- R Cars93 1993 年美國銷售的 93 輛汽車的數據
- R predict.lda 通過線性判別對多變量觀測值進行分類
- R geyser 老忠實間歇泉數據
- R summary.negbin 類“negbin”對象的摘要方法函數
- R Aids2 澳大利亞艾滋病生存數據
- R truehist 繪製直方圖
- R mcycle 來自模擬摩托車事故的數據
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Maximum-likelihood Fitting of Univariate Distributions。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。