xtabs
位于 stats
包(package)。 说明
使用公式接口从通常包含在 DataFrame 中的交叉分类因子创建列联表(可选稀疏矩阵)。
用法
xtabs(formula = ~., data = parent.frame(), subset, sparse = FALSE,
na.action, addNA = FALSE, exclude = if(!addNA) c(NA, NaN),
drop.unused.levels = FALSE)
## S3 method for class 'xtabs'
print(x, na.print = "", ...)
参数
formula |
右侧带有交叉分类变量(由 |
data |
包含公式 |
subset |
一个可选向量,指定要使用的观测子集。 |
sparse |
逻辑指定结果是否应该是稀疏矩阵,即从 |
na.action |
|
addNA |
逻辑指示 |
exclude |
形成分类因子级别集时要排除的值向量。 |
drop.unused.levels |
指示是否删除分类因子中未使用的级别的逻辑。如果这是 |
x |
类 |
na.print |
指示如何打印 |
... |
传入或传出其他方法的进一步参数。 |
细节
对于由 table
或 xtabs(*, sparse = FALSE)
创建的列联表对象,有一个 summary
方法,它提供基本信息并执行因子独立性的卡方检验(请注意,函数 chisq.test
目前仅处理 2-d表)。
如果在 formula
中给出左侧,则其条目将简单地对对应于右侧的单元格求和;如果 lhs 没有给出计数,这也适用。
对于formula
中作为因子的变量,必须显式指定exclude
;将不会使用默认的排除项。
在R3.4.0 之前的版本,例如,当na.action = na.pass
,有时为零(0
)被返回而不是NA
s.
请注意,当 addNA
默认为 false,并且未指定 na.action
(或设置为 NULL
)时,实际上使用 na.action =
getOption("na.action", default=na.omit)
;另请参见示例。
值
默认情况下,当 sparse = FALSE
时,是 S3 类 c("xtabs",
"table")
的数组表示形式的列联表,其中 "call"
属性存储匹配的调用。
当 sparse = TRUE
时,稀疏数值矩阵,特别是包 Matrix
中的 S4 类 dgTMatrix
的对象。
例子
## 'esoph' has the frequencies of cases and controls for all levels of
## the variables 'agegp', 'alcgp', and 'tobgp'.
xtabs(cbind(ncases, ncontrols) ~ ., data = esoph)
## Output is not really helpful ... flat tables are better:
ftable(xtabs(cbind(ncases, ncontrols) ~ ., data = esoph))
## In particular if we have fewer factors ...
ftable(xtabs(cbind(ncases, ncontrols) ~ agegp, data = esoph))
## This is already a contingency table in array form.
DF <- as.data.frame(UCBAdmissions)
## Now 'DF' is a data frame with a grid of the factors and the counts
## in variable 'Freq'.
DF
## Nice for taking margins ...
xtabs(Freq ~ Gender + Admit, DF)
## And for testing independence ...
summary(xtabs(Freq ~ ., DF))
## with NA's
DN <- DF; DN[cbind(6:9, c(1:2,4,1))] <- NA
DN # 'Freq' is missing only for (Rejected, Female, B)
tools::assertError(# 'na.fail' should fail :
xtabs(Freq ~ Gender + Admit, DN, na.action=na.fail), verbose=TRUE)
op <- options(na.action = "na.omit") # the "factory" default
(xtabs(Freq ~ Gender + Admit, DN) -> xtD)
noC <- function(O) `attr<-`(O, "call", NULL)
ident_noC <- function(x,y) identical(noC(x), noC(y))
stopifnot(exprs = {
ident_noC(xtD, xtabs(Freq ~ Gender + Admit, DN, na.action = na.omit))
ident_noC(xtD, xtabs(Freq ~ Gender + Admit, DN, na.action = NULL))
})
xtabs(Freq ~ Gender + Admit, DN, na.action = na.pass)
## The Female:Rejected combination has NA 'Freq' (and NA prints 'invisibly' as "")
(xtNA <- xtabs(Freq ~ Gender + Admit, DN, addNA = TRUE)) # ==> count NAs
## show NA's better via na.print = ".." :
print(xtNA, na.print= "NA")
## Create a nice display for the warp break data.
warpbreaks$replicate <- rep_len(1:9, 54)
ftable(xtabs(breaks ~ wool + tension + replicate, data = warpbreaks))
### ---- Sparse Examples ----
if(require("Matrix")) withAutoprint({
## similar to "nlme"s 'ergoStool' :
d.ergo <- data.frame(Type = paste0("T", rep(1:4, 9*4)),
Subj = gl(9, 4, 36*4))
xtabs(~ Type + Subj, data = d.ergo) # 4 replicates each
set.seed(15) # a subset of cases:
xtabs(~ Type + Subj, data = d.ergo[sample(36, 10), ], sparse = TRUE)
## Hypothetical two-level setup:
inner <- factor(sample(letters[1:25], 100, replace = TRUE))
inout <- factor(sample(LETTERS[1:5], 25, replace = TRUE))
fr <- data.frame(inner = inner, outer = inout[as.integer(inner)])
xtabs(~ inner + outer, fr, sparse = TRUE)
})
也可以看看
table
表示传统的cross-tabulation,as.data.frame.table
是xtabs
的逆运算(请参见下面的DF
示例)。
sparseMatrix
包中的稀疏矩阵 Matrix
。
相关用法
- R stlmethods STL 对象的方法
- R medpolish 矩阵的中值波兰(稳健双向分解)
- R naprint 调整缺失值
- R summary.nls 总结非线性最小二乘模型拟合
- R summary.manova 多元方差分析的汇总方法
- R formula 模型公式
- R nls.control 控制 nls 中的迭代
- R aggregate 计算数据子集的汇总统计
- R deriv 简单表达式的符号和算法导数
- R kruskal.test Kruskal-Wallis 秩和检验
- R quade.test 四方测试
- R decompose 移动平均线的经典季节性分解
- R plot.stepfun 绘制阶跃函数
- R alias 查找模型中的别名(依赖项)
- R qqnorm 分位数-分位数图
- R eff.aovlist 多层方差分析的计算效率
- R pairwise.t.test 成对 t 检验
- R loglin 拟合对数线性模型
- R predict.smooth.spline 通过平滑样条拟合进行预测
- R bartlett.test 方差齐性的 Bartlett 检验
- R influence.measures 回归删除诊断
- R loess.control 设置黄土参数
- R Normal 正态分布
- R summary.lm 总结线性模型拟合
- R Uniform 均匀分布
注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Cross Tabulation。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。