當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R xtabs 交叉列表


R語言 xtabs 位於 stats 包(package)。

說明

使用公式接口從通常包含在 DataFrame 中的交叉分類因子創建列聯表(可選稀疏矩陣)。

用法

xtabs(formula = ~., data = parent.frame(), subset, sparse = FALSE,
      na.action, addNA = FALSE, exclude = if(!addNA) c(NA, NaN),
      drop.unused.levels = FALSE)

## S3 method for class 'xtabs'
print(x, na.print = "", ...)

參數

formula

右側帶有交叉分類變量(由 + 分隔)的 formula 對象(或可以強製為公式的對象)。不允許互動。在左側,可以選擇給出一個向量或計數矩陣;在後一種情況下,列被解釋為對應於變量的級別。如果數據已製成表格,這很有用,請參閱下麵的示例。

data

包含公式 formula 中的變量的可選矩陣或 DataFrame (或類似的:請參閱 model.frame )。默認情況下,變量取自environment(formula)

subset

一個可選向量,指定要使用的觀測子集。

sparse

邏輯指定結果是否應該是稀疏矩陣,即從 sparseMatrix 繼承僅適用於兩個因子(因為還沒有高階稀疏數組類)。

na.action

function 指示當數據包含 NA 時應該發生什麽。如果未指定,並且 addNA 為 true,則設置為 na.pass 。當它是na.omit並且formula有左側(有計數)時,使用sum(*, na.rm = TRUE)代替sum(*)進行計數。

addNA

邏輯指示 NA 是否應該獲得單獨的級別並進行計數,使用 addNA(*, ifany=TRUE) 並將 na.action 的默認值設置為 na.pass

exclude

形成分類因子級別集時要排除的值向量。

drop.unused.levels

指示是否刪除分類因子中未使用的級別的邏輯。如果這是 FALSE 並且存在未使用的級別,則該表將包含零邊際,並且隨後的因子獨立性卡方檢驗將不起作用。

x

"xtabs" 的對象。

na.print

指示如何打印 NA 的字符串(或 NULL )。默認值 ( "" ) 不會清楚地顯示 NA ,建議使用 na.print = "NA" 代替。

...

傳入或傳出其他方法的進一步參數。

細節

對於由 tablextabs(*, sparse = FALSE) 創建的列聯表對象,有一個 summary 方法,它提供基本信息並執行因子獨立性的卡方檢驗(請注意,函數 chisq.test 目前僅處理 2-d表)。

如果在 formula 中給出左側,則其條目將簡單地對對應於右側的單元格求和;如果 lhs 沒有給出計數,這也適用。

對於formula中作為因子的變量,必須顯式指定exclude;將不會使用默認的排除項。

R3.4.0 之前的版本,例如,當na.action = na.pass,有時為零(0)被返回而不是NAs.

請注意,當 addNA 默認為 false,並且未指定 na.action(或設置為 NULL )時,實際上使用 na.action = getOption("na.action", default=na.omit) ;另請參見示例。

默認情況下,當 sparse = FALSE 時,是 S3 類 c("xtabs", "table") 的數組表示形式的列聯表,其中 "call" 屬性存儲匹配的調用。

sparse = TRUE 時,稀疏數值矩陣,特別是包 Matrix 中的 S4 類 dgTMatrix 的對象。

例子

## 'esoph' has the frequencies of cases and controls for all levels of
## the variables 'agegp', 'alcgp', and 'tobgp'.
xtabs(cbind(ncases, ncontrols) ~ ., data = esoph)
## Output is not really helpful ... flat tables are better:
ftable(xtabs(cbind(ncases, ncontrols) ~ ., data = esoph))
## In particular if we have fewer factors ...
ftable(xtabs(cbind(ncases, ncontrols) ~ agegp, data = esoph))

## This is already a contingency table in array form.
DF <- as.data.frame(UCBAdmissions)
## Now 'DF' is a data frame with a grid of the factors and the counts
## in variable 'Freq'.
DF
## Nice for taking margins ...
xtabs(Freq ~ Gender + Admit, DF)
## And for testing independence ...
summary(xtabs(Freq ~ ., DF))

## with NA's
DN <- DF; DN[cbind(6:9, c(1:2,4,1))] <- NA
DN # 'Freq' is missing only for (Rejected, Female, B)
tools::assertError(# 'na.fail' should fail :
     xtabs(Freq ~ Gender + Admit, DN, na.action=na.fail), verbose=TRUE)
op <- options(na.action = "na.omit") # the "factory" default
(xtabs(Freq ~ Gender + Admit, DN) -> xtD)
noC <- function(O) `attr<-`(O, "call", NULL)
ident_noC <- function(x,y) identical(noC(x), noC(y))
stopifnot(exprs = {
  ident_noC(xtD, xtabs(Freq ~ Gender + Admit, DN, na.action = na.omit))
  ident_noC(xtD, xtabs(Freq ~ Gender + Admit, DN, na.action = NULL))
})

xtabs(Freq ~ Gender + Admit, DN, na.action = na.pass)
## The Female:Rejected combination has NA 'Freq' (and NA prints 'invisibly' as "")
(xtNA <- xtabs(Freq ~ Gender + Admit, DN, addNA = TRUE)) # ==> count NAs
## show NA's better via  na.print = ".." :
print(xtNA, na.print= "NA")


## Create a nice display for the warp break data.
warpbreaks$replicate <- rep_len(1:9, 54)
ftable(xtabs(breaks ~ wool + tension + replicate, data = warpbreaks))

### ---- Sparse Examples ----

if(require("Matrix")) withAutoprint({
 ## similar to "nlme"s  'ergoStool' :
 d.ergo <- data.frame(Type = paste0("T", rep(1:4, 9*4)),
                      Subj = gl(9, 4, 36*4))
 xtabs(~ Type + Subj, data = d.ergo) # 4 replicates each
 set.seed(15) # a subset of cases:
 xtabs(~ Type + Subj, data = d.ergo[sample(36, 10), ], sparse = TRUE)

 ## Hypothetical two-level setup:
 inner <- factor(sample(letters[1:25], 100, replace = TRUE))
 inout <- factor(sample(LETTERS[1:5], 25, replace = TRUE))
 fr <- data.frame(inner = inner, outer = inout[as.integer(inner)])
 xtabs(~ inner + outer, fr, sparse = TRUE)
})

也可以看看

table 表示傳統的cross-tabulation,as.data.frame.tablextabs 的逆運算(請參見下麵的DF 示例)。

sparseMatrix 包中的稀疏矩陣 Matrix

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Cross Tabulation。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。