當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


R SparkR crosstab用法及代碼示例

說明:

計算給定列的pair-wise 頻率表。也稱為列聯表。每列的不同值的數量應小於 1e4。最多將返回 1e6 個非零對頻率。

用法:

## S4 method for signature 'SparkDataFrame,character,character'
crosstab(x, col1, col2)

參數:

  • x 一個 SparkDataFrame
  • col1 第一列的名稱。不同的項目將成為每行的第一項。
  • col2 第二列的名稱。不同的項目將使輸出的列名。

返回:

表示列聯表的本地 R data.frame。每行的第一列將是 col1 的不同值,列名將是 col2 的不同值。第一列的名稱將是“col1 _ col2”。沒有出現的對的計數為零。

注意:

自 1.5.0 以來的交叉表

例子:

df <- read.json("/path/to/file.json")
ct <- crosstab(df, "title", "gender")

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 Computes a pair-wise frequency table of the given columns。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。