当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R xtabs 交叉列表


R语言 xtabs 位于 stats 包(package)。

说明

使用公式接口从通常包含在 DataFrame 中的交叉分类因子创建列联表(可选稀疏矩阵)。

用法

xtabs(formula = ~., data = parent.frame(), subset, sparse = FALSE,
      na.action, addNA = FALSE, exclude = if(!addNA) c(NA, NaN),
      drop.unused.levels = FALSE)

## S3 method for class 'xtabs'
print(x, na.print = "", ...)

参数

formula

右侧带有交叉分类变量(由 + 分隔)的 formula 对象(或可以强制为公式的对象)。不允许互动。在左侧,可以选择给出一个向量或计数矩阵;在后一种情况下,列被解释为对应于变量的级别。如果数据已制成表格,这很有用,请参阅下面的示例。

data

包含公式 formula 中的变量的可选矩阵或 DataFrame (或类似的:请参阅 model.frame )。默认情况下,变量取自environment(formula)

subset

一个可选向量,指定要使用的观测子集。

sparse

逻辑指定结果是否应该是稀疏矩阵,即从 sparseMatrix 继承仅适用于两个因子(因为还没有高阶稀疏数组类)。

na.action

function 指示当数据包含 NA 时应该发生什么。如果未指定,并且 addNA 为 true,则设置为 na.pass 。当它是na.omit并且formula有左侧(有计数)时,使用sum(*, na.rm = TRUE)代替sum(*)进行计数。

addNA

逻辑指示 NA 是否应该获得单独的级别并进行计数,使用 addNA(*, ifany=TRUE) 并将 na.action 的默认值设置为 na.pass

exclude

形成分类因子级别集时要排除的值向量。

drop.unused.levels

指示是否删除分类因子中未使用的级别的逻辑。如果这是 FALSE 并且存在未使用的级别,则该表将包含零边际,并且随后的因子独立性卡方检验将不起作用。

x

"xtabs" 的对象。

na.print

指示如何打印 NA 的字符串(或 NULL )。默认值 ( "" ) 不会清楚地显示 NA ,建议使用 na.print = "NA" 代替。

...

传入或传出其他方法的进一步参数。

细节

对于由 tablextabs(*, sparse = FALSE) 创建的列联表对象,有一个 summary 方法,它提供基本信息并执行因子独立性的卡方检验(请注意,函数 chisq.test 目前仅处理 2-d表)。

如果在 formula 中给出左侧,则其条目将简单地对对应于右侧的单元格求和;如果 lhs 没有给出计数,这也适用。

对于formula中作为因子的变量,必须显式指定exclude;将不会使用默认的排除项。

R3.4.0 之前的版本,例如,当na.action = na.pass,有时为零(0)被返回而不是NAs.

请注意,当 addNA 默认为 false,并且未指定 na.action(或设置为 NULL )时,实际上使用 na.action = getOption("na.action", default=na.omit) ;另请参见示例。

默认情况下,当 sparse = FALSE 时,是 S3 类 c("xtabs", "table") 的数组表示形式的列联表,其中 "call" 属性存储匹配的调用。

sparse = TRUE 时,稀疏数值矩阵,特别是包 Matrix 中的 S4 类 dgTMatrix 的对象。

例子

## 'esoph' has the frequencies of cases and controls for all levels of
## the variables 'agegp', 'alcgp', and 'tobgp'.
xtabs(cbind(ncases, ncontrols) ~ ., data = esoph)
## Output is not really helpful ... flat tables are better:
ftable(xtabs(cbind(ncases, ncontrols) ~ ., data = esoph))
## In particular if we have fewer factors ...
ftable(xtabs(cbind(ncases, ncontrols) ~ agegp, data = esoph))

## This is already a contingency table in array form.
DF <- as.data.frame(UCBAdmissions)
## Now 'DF' is a data frame with a grid of the factors and the counts
## in variable 'Freq'.
DF
## Nice for taking margins ...
xtabs(Freq ~ Gender + Admit, DF)
## And for testing independence ...
summary(xtabs(Freq ~ ., DF))

## with NA's
DN <- DF; DN[cbind(6:9, c(1:2,4,1))] <- NA
DN # 'Freq' is missing only for (Rejected, Female, B)
tools::assertError(# 'na.fail' should fail :
     xtabs(Freq ~ Gender + Admit, DN, na.action=na.fail), verbose=TRUE)
op <- options(na.action = "na.omit") # the "factory" default
(xtabs(Freq ~ Gender + Admit, DN) -> xtD)
noC <- function(O) `attr<-`(O, "call", NULL)
ident_noC <- function(x,y) identical(noC(x), noC(y))
stopifnot(exprs = {
  ident_noC(xtD, xtabs(Freq ~ Gender + Admit, DN, na.action = na.omit))
  ident_noC(xtD, xtabs(Freq ~ Gender + Admit, DN, na.action = NULL))
})

xtabs(Freq ~ Gender + Admit, DN, na.action = na.pass)
## The Female:Rejected combination has NA 'Freq' (and NA prints 'invisibly' as "")
(xtNA <- xtabs(Freq ~ Gender + Admit, DN, addNA = TRUE)) # ==> count NAs
## show NA's better via  na.print = ".." :
print(xtNA, na.print= "NA")


## Create a nice display for the warp break data.
warpbreaks$replicate <- rep_len(1:9, 54)
ftable(xtabs(breaks ~ wool + tension + replicate, data = warpbreaks))

### ---- Sparse Examples ----

if(require("Matrix")) withAutoprint({
 ## similar to "nlme"s  'ergoStool' :
 d.ergo <- data.frame(Type = paste0("T", rep(1:4, 9*4)),
                      Subj = gl(9, 4, 36*4))
 xtabs(~ Type + Subj, data = d.ergo) # 4 replicates each
 set.seed(15) # a subset of cases:
 xtabs(~ Type + Subj, data = d.ergo[sample(36, 10), ], sparse = TRUE)

 ## Hypothetical two-level setup:
 inner <- factor(sample(letters[1:25], 100, replace = TRUE))
 inout <- factor(sample(LETTERS[1:5], 25, replace = TRUE))
 fr <- data.frame(inner = inner, outer = inout[as.integer(inner)])
 xtabs(~ inner + outer, fr, sparse = TRUE)
})

也可以看看

table 表示传统的cross-tabulation,as.data.frame.tablextabs 的逆运算(请参见下面的DF 示例)。

sparseMatrix 包中的稀疏矩阵 Matrix

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Cross Tabulation。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。