当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R mosaicplot 马赛克图


R语言 mosaicplot 位于 graphics 包(package)。

说明

在当前图形设备上绘制马赛克。

用法

mosaicplot(x, ...)

## Default S3 method:
mosaicplot(x, main = deparse1(substitute(x)),
           sub = NULL, xlab = NULL, ylab = NULL,
           sort = NULL, off = NULL, dir = NULL,
           color = NULL, shade = FALSE, margin = NULL,
           cex.axis = 0.66, las = par("las"), border = NULL,
           type = c("pearson", "deviance", "FT"), ...)

## S3 method for class 'formula'
mosaicplot(formula, data = NULL, ...,
           main = deparse1(substitute(data)), subset,
           na.action = stats::na.omit)

参数

x

数组形式的列联表,带有在 dimnames(x) 属性中指定的可选类别标签。该表最好由 table() 命令创建。

main

马赛克标题的字符串。

sub

马赛克副标题的字符串(位于底部)。

xlab, ylab

用于绘图的 x 轴和 y 轴标签;默认情况下,names(dimnames(X)) 的第一个和第二个元素(即 X 中第一个和第二个变量的名称)。

sort

变量的向量排序,包含整数的排列1:length(dim(x))(默认值)。

off

偏移向量,用于确定马赛克每个级别的百分比间距(适当的值在 0 到 20 之间,默认值是二维表分割数的 20 倍,否则为 10)。重新调整为最大 50,并在必要时回收。

dir

马赛克每一层的分割方向向量("v" 表示垂直,"h" 表示水平),列联表的每个维度都有一个方向。默认由交替方向组成,从垂直分割开始。

color

用于颜色着色的逻辑或(回收)颜色向量,仅当 shadeFALSENULL (默认)时使用。默认情况下,绘制灰色框。 color = TRUE 使用 grey.colors 作为伽马校正灰色调色板。 color = FALSE 给出没有阴影的空框。

shade

指示是否生成扩展马赛克图的逻辑值,或最多 5 个不同正数的数值向量,给出残差切割点的绝对值。默认情况下, shadeFALSE ,并创建简单的马赛克。使用 shade = TRUE 削减 2 和 4 处的绝对值。

margin

具有适合对数线性模型的边际总计的向量列表。默认情况下,安装独立模型。有关更多信息,请参阅loglin

cex.axis

用于轴注释的放大倍数,为 par("cex") 的倍数。

las

数字;轴标签的样式,请参见par

border

单元格边框的颜色:参见polygon

type

指示要表示的残差类型的字符串。必须是 "pearson" (给出 Pearson 的分量)、"deviance" (给出似然比 的分量)或 Freeman-Tukey 残差的 "FT" 之一。该参数的值可以缩写。

formula

公式,例如 y ~ x

data

DataFrame (或列表)或列联表,应从中获取 formula 中的变量。

...

要传递给方法或从方法传递的更多参数。

subset

一个可选向量,指定 DataFrame 中用于绘图的观测值子集。

na.action

一个函数,指示当数据包含变量为cross-tabulated并且这些变量包含NA时应该发生什么。默认情况下,忽略任何变量中具有 NA 的情况。由于制表将忽略所有包含缺失值的情况,因此只有在 na.action 函数替换缺失值时这才有用。

细节

这是一个通用函数。它目前有一个默认方法(mosaicplot.default)和一个公式接口(mosaicplot.formula)。

扩展马赛克显示通过马赛克图块的颜色和轮廓可视化表格的对数线性模型的标准化残差。 (标准化残差通常称为标准正态分布。)代表负残差的单元格以红色阴影绘制并带有虚线边框;积极的部分用蓝色绘制,并带有实线边框。

对于公式方法,如果data是继承自类"table"或类"ftable"的对象或大于2维的数组,则将其视为列联表,因此所有条目都应为非负数。在这种情况下,formula 的左侧应为空,右侧的变量应取自列联表的 dimnames 属性的名称。计算这些变量的边际表,并生成该表的马赛克图。

否则,data 应该是包含 cross-tabulated 变量的 DataFrame 或矩阵、列表或环境。在这种情况下,在可能选择 subset 参数指定的数据子集之后,根据 formula 中给出的变量计算列联表,并由此生成马赛克。

请参阅 Emerson (1998) 了解更多信息以及来自 Nielsen Media Research 的电视观众数据的案例研究。

data 包含变量 cross-tabulated 时,不支持缺失值,除非通过 na.action 函数。

在贡献包 vcd 中的函数 mosaic 中提供了以网格图形系统编写的马赛克图的更灵活和可扩展的实现(Meyer、Zeileis 和 Hornik,2006)。

例子

require(stats)
mosaicplot(Titanic, main = "Survival on the Titanic", color = TRUE)
## Formula interface for tabulated data:
mosaicplot(~ Sex + Age + Survived, data = Titanic, color = TRUE)

mosaicplot(HairEyeColor, shade = TRUE)
## Independence model of hair and eye color and sex.  Indicates that
## there are more blue eyed blonde females than expected in the case
## of independence and too few brown eyed blonde females.
## The corresponding model is:
fm <- loglin(HairEyeColor, list(1, 2, 3))
pchisq(fm$pearson, fm$df, lower.tail = FALSE)

mosaicplot(HairEyeColor, shade = TRUE, margin = list(1:2, 3))
## Model of joint independence of sex from hair and eye color.  Males
## are underrepresented among people with brown hair and eyes, and are
## overrepresented among people with brown hair and blue eyes.
## The corresponding model is:
fm <- loglin(HairEyeColor, list(1:2, 3))
pchisq(fm$pearson, fm$df, lower.tail = FALSE)

## Formula interface for raw data: visualize cross-tabulation of numbers
## of gears and carburettors in Motor Trend car data.
mosaicplot(~ gear + carb, data = mtcars, color = TRUE, las = 1)
# color recycling
mosaicplot(~ gear + carb, data = mtcars, color = 2:3, las = 1)

作者

S-PLUS original by John Emerson john.emerson@yale.edu. Originally modified and enhanced for R by Kurt Hornik.

参考

Hartigan, J.A., and Kleiner, B. (1984). A mosaic of television ratings. The American Statistician, 38, 32-35. doi:10.2307/2683556.

Emerson, J. W. (1998). Mosaic displays in S-PLUS: A general implementation and a case study. Statistical Computing and Graphics Newsletter (ASA), 9, 1, 17-23.

Friendly, M. (1994). Mosaic displays for multi-way contingency tables. Journal of the American Statistical Association, 89, 190-200. doi:10.2307/2291215.

Meyer, D., Zeileis, A., and Hornik, K. (2006) The strucplot Framework: Visualizing Multi-Way Contingency Tables with vcd. Journal of Statistical Software, 17(3), 1-48. doi:10.18637/jss.v017.i03.

也可以看看

assocplotloglin

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Mosaic Plots。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。