当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R SparkR crosstab用法及代码示例


说明:

计算给定列的pair-wise 频率表。也称为列联表。每列的不同值的数量应小于 1e4。最多将返回 1e6 个非零对频率。

用法:

## S4 method for signature 'SparkDataFrame,character,character'
crosstab(x, col1, col2)

参数:

  • x 一个 SparkDataFrame
  • col1 第一列的名称。不同的项目将成为每行的第一项。
  • col2 第二列的名称。不同的项目将使输出的列名。

返回:

表示列联表的本地 R data.frame。每行的第一列将是 col1 的不同值,列名将是 col2 的不同值。第一列的名称将是“col1 _ col2”。没有出现的对的计数为零。

注意:

自 1.5.0 以来的交叉表

例子:

df <- read.json("/path/to/file.json")
ct <- crosstab(df, "title", "gender")

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 Computes a pair-wise frequency table of the given columns。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。