R SparkR freqItems用法及代碼示例

查找列的頻繁項，可能有誤報。使用由 Karp、Schenker 和 Papadimitriou 提出的 https://dl.acm.org/doi/10.1145/762471.762473 中說明的頻繁元素計數算法。

## S4 method for signature 'SparkDataFrame,character'
freqItems(x, cols, support = 0.01)

本地 R DataFrame ，每列中包含頻繁項

freqItems 自 1.6.0 起

df <- read.json("/path/to/file.json")
fi = freqItems(df, c("title", "gender"))

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 Finding frequent items for columns, possibly with false positives。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。