说明:
计算给定列的pair-wise 频率表。也称为列联表。每列的不同值的数量应小于 1e4。最多将返回 1e6 个非零对频率。
用法:
## S4 method for signature 'SparkDataFrame,character,character'
crosstab(x, col1, col2)
参数:
x
一个 SparkDataFramecol1
第一列的名称。不同的项目将成为每行的第一项。col2
第二列的名称。不同的项目将使输出的列名。
返回:
表示列联表的本地 R data.frame。每行的第一列将是 col1
的不同值,列名将是 col2
的不同值。第一列的名称将是“col1
_ col2
”。没有出现的对的计数为零。
注意:
自 1.5.0 以来的交叉表
例子:
df <- read.json("/path/to/file.json")
ct <- crosstab(df, "title", "gender")
相关用法
- R SparkR crossJoin用法及代码示例
- R SparkR createDataFrame用法及代码示例
- R SparkR createOrReplaceTempView用法及代码示例
- R SparkR createTable用法及代码示例
- R SparkR createExternalTable用法及代码示例
- R SparkR count用法及代码示例
- R SparkR column用法及代码示例
- R SparkR columns用法及代码示例
- R SparkR cube用法及代码示例
- R SparkR corr用法及代码示例
- R SparkR cast用法及代码示例
- R SparkR cacheTable用法及代码示例
- R SparkR checkpoint用法及代码示例
- R SparkR cov用法及代码示例
- R SparkR cache用法及代码示例
- R SparkR currentDatabase用法及代码示例
- R SparkR collect用法及代码示例
- R SparkR coltypes用法及代码示例
- R SparkR coalesce用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 Computes a pair-wise frequency table of the given columns。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。