當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R cdplot 條件密度圖


R語言 cdplot 位於 graphics 包(package)。

說明

計算並繪製條件密度,說明分類變量 y 的條件分布如何隨數值變量 x 變化。

用法

cdplot(x, ...)

## Default S3 method:
cdplot(x, y,
  plot = TRUE, tol.ylab = 0.05, ylevels = NULL,
  bw = "nrd0", n = 512, from = NULL, to = NULL,
  col = NULL, border = 1, main = "", xlab = NULL, ylab = NULL,
  yaxlabels = NULL, xlim = NULL, ylim = c(0, 1), weights = NULL, ...)

## S3 method for class 'formula'
cdplot(formula, data = list(),
  plot = TRUE, tol.ylab = 0.05, ylevels = NULL,
  bw = "nrd0", n = 512, from = NULL, to = NULL,
  col = NULL, border = 1, main = "", xlab = NULL, ylab = NULL,
  yaxlabels = NULL, xlim = NULL, ylim = c(0, 1), ...,
  subset = NULL, weights = NULL)

參數

x

一個對象,默認方法需要一個數值變量(或一個可強製執行此變量的對象)。

y

"factor" 解釋為因變量

formula

y ~ x 類型的 "formula",具有單個因變量 "factor" 和單個數值解釋變量。

data

一個可選的 DataFrame 。

plot

合乎邏輯的。是否應該繪製計算出的條件密度?

tol.ylab

y 軸注釋的方便公差參數。如果兩個標簽之間的距離低於此閾值,則會等距繪製它們。

ylevels

一個字符或數值向量,指定應按什麽順序繪製因變量的水平。

bw , n , from , to , ...

傳遞給density的參數

col

levels(y) 長度相同的填充顏色向量。默認是調用 gray.colors

border

陰影多邊形的邊框顏色。

main , xlab , ylab

注釋字符串

yaxlabels

y 軸注釋的字符向量,默認為 levels(y)

xlim , ylim

具有合理默認值的 x 和 y 值的範圍。

subset

一個可選向量,指定用於繪圖的觀測值子集。

weights

數字。數據中每個觀測值的頻率權重向量。如果NULL所有權重都隱式假設為1。

細節

cdplot 計算 x 的條件密度,給定由 y 的邊際分布加權的 y 級別。密度是在 y 的級別上累積得出的。

這種可視化技術類似於旋轉圖(參見 spineplot ),並繪製 的關係圖。條件概率不是通過離散化導出的(如在脊柱圖中),而是通過 density 使用平滑方法。

請注意,對於 的高密度區域,條件密度的估計更可靠。相反,在隻有很少 觀測值的區域,它們的可靠性較低。

條件密度函數(在 y 級別上累積)以不可見的方式返回。

例子

## NASA space shuttle o-ring failures
fail <- factor(c(2, 2, 2, 2, 1, 1, 1, 1, 1, 1, 2, 1, 2, 1, 1, 1,
                 1, 2, 1, 1, 1, 1, 1),
               levels = 1:2, labels = c("no", "yes"))
temperature <- c(53, 57, 58, 63, 66, 67, 67, 67, 68, 69, 70, 70,
                 70, 70, 72, 73, 75, 75, 76, 76, 78, 79, 81)

## CD plot
cdplot(fail ~ temperature)
cdplot(fail ~ temperature, bw = 2)
cdplot(fail ~ temperature, bw = "SJ")

## compare with spinogram
(spineplot(fail ~ temperature, breaks = 3))

## highlighting for failures
cdplot(fail ~ temperature, ylevels = 2:1)

## scatter plot with conditional density
cdens <- cdplot(fail ~ temperature, plot = FALSE)
plot(I(as.numeric(fail) - 1) ~ jitter(temperature, factor = 2),
     xlab = "Temperature", ylab = "Conditional failure probability")
lines(53:81, 1 - cdens[[1]](53:81), col = 2)

作者

Achim Zeileis Achim.Zeileis@R-project.org

參考

Hofmann, H., Theus, M. (2005), Interactive graphics for visualizing conditional distributions, Unpublished Manuscript.

也可以看看

spineplot , density

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Conditional Density Plots。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。