当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R cdplot 条件密度图


R语言 cdplot 位于 graphics 包(package)。

说明

计算并绘制条件密度,说明分类变量 y 的条件分布如何随数值变量 x 变化。

用法

cdplot(x, ...)

## Default S3 method:
cdplot(x, y,
  plot = TRUE, tol.ylab = 0.05, ylevels = NULL,
  bw = "nrd0", n = 512, from = NULL, to = NULL,
  col = NULL, border = 1, main = "", xlab = NULL, ylab = NULL,
  yaxlabels = NULL, xlim = NULL, ylim = c(0, 1), weights = NULL, ...)

## S3 method for class 'formula'
cdplot(formula, data = list(),
  plot = TRUE, tol.ylab = 0.05, ylevels = NULL,
  bw = "nrd0", n = 512, from = NULL, to = NULL,
  col = NULL, border = 1, main = "", xlab = NULL, ylab = NULL,
  yaxlabels = NULL, xlim = NULL, ylim = c(0, 1), ...,
  subset = NULL, weights = NULL)

参数

x

一个对象,默认方法需要一个数值变量(或一个可强制执行此变量的对象)。

y

"factor" 解释为因变量

formula

y ~ x 类型的 "formula",具有单个因变量 "factor" 和单个数值解释变量。

data

一个可选的 DataFrame 。

plot

合乎逻辑的。是否应该绘制计算出的条件密度?

tol.ylab

y 轴注释的方便公差参数。如果两个标签之间的距离低于此阈值,则会等距绘制它们。

ylevels

一个字符或数值向量,指定应按什么顺序绘制因变量的水平。

bw , n , from , to , ...

传递给density的参数

col

levels(y) 长度相同的填充颜色向量。默认是调用 gray.colors

border

阴影多边形的边框颜色。

main , xlab , ylab

注释字符串

yaxlabels

y 轴注释的字符向量,默认为 levels(y)

xlim , ylim

具有合理默认值的 x 和 y 值的范围。

subset

一个可选向量,指定用于绘图的观测值子集。

weights

数字。数据中每个观测值的频率权重向量。如果NULL所有权重都隐式假设为1。

细节

cdplot 计算 x 的条件密度,给定由 y 的边际分布加权的 y 级别。密度是在 y 的级别上累积得出的。

这种可视化技术类似于旋转图(参见 spineplot ),并绘制 的关系图。条件概率不是通过离散化导出的(如在脊柱图中),而是通过 density 使用平滑方法。

请注意,对于 的高密度区域,条件密度的估计更可靠。相反,在只有很少 观测值的区域,它们的可靠性较低。

条件密度函数(在 y 级别上累积)以不可见的方式返回。

例子

## NASA space shuttle o-ring failures
fail <- factor(c(2, 2, 2, 2, 1, 1, 1, 1, 1, 1, 2, 1, 2, 1, 1, 1,
                 1, 2, 1, 1, 1, 1, 1),
               levels = 1:2, labels = c("no", "yes"))
temperature <- c(53, 57, 58, 63, 66, 67, 67, 67, 68, 69, 70, 70,
                 70, 70, 72, 73, 75, 75, 76, 76, 78, 79, 81)

## CD plot
cdplot(fail ~ temperature)
cdplot(fail ~ temperature, bw = 2)
cdplot(fail ~ temperature, bw = "SJ")

## compare with spinogram
(spineplot(fail ~ temperature, breaks = 3))

## highlighting for failures
cdplot(fail ~ temperature, ylevels = 2:1)

## scatter plot with conditional density
cdens <- cdplot(fail ~ temperature, plot = FALSE)
plot(I(as.numeric(fail) - 1) ~ jitter(temperature, factor = 2),
     xlab = "Temperature", ylab = "Conditional failure probability")
lines(53:81, 1 - cdens[[1]](53:81), col = 2)

作者

Achim Zeileis Achim.Zeileis@R-project.org

参考

Hofmann, H., Theus, M. (2005), Interactive graphics for visualizing conditional distributions, Unpublished Manuscript.

也可以看看

spineplot , density

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Conditional Density Plots。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。