說明:
查找列的頻繁項,可能有誤報。使用由 Karp、Schenker 和 Papadimitriou 提出的 https://dl.acm.org/doi/10.1145/762471.762473 中說明的頻繁元素計數算法。
用法:
## S4 method for signature 'SparkDataFrame,character'
freqItems(x, cols, support = 0.01)
參數:
x
一個 SparkDataFrame。cols
用於搜索頻繁項的向量列名稱。support
(可選)要考慮的項目的最小頻率frequent
。應大於 1e-4。默認支持 = 0.01。
返回:
本地 R DataFrame ,每列中包含頻繁項
注意:
freqItems 自 1.6.0 起
例子:
df <- read.json("/path/to/file.json")
fi = freqItems(df, c("title", "gender"))
相關用法
- R SparkR first用法及代碼示例
- R SparkR fitted用法及代碼示例
- R SparkR filter用法及代碼示例
- R matrix轉list用法及代碼示例
- R SparkR intersectAll用法及代碼示例
- R SparkR spark.decisionTree用法及代碼示例
- R SparkR sparkR.callJMethod用法及代碼示例
- R SparkR sample用法及代碼示例
- R SparkR approxQuantile用法及代碼示例
- R SparkR glm用法及代碼示例
- R SparkR randomSplit用法及代碼示例
- R SparkR describe用法及代碼示例
- R SparkR withColumn用法及代碼示例
- R SparkR read.stream用法及代碼示例
- R SparkR join用法及代碼示例
- R SparkR rbind用法及代碼示例
- R SparkR windowPartitionBy用法及代碼示例
- R SparkR count用法及代碼示例
- R SparkR column用法及代碼示例
- R SparkR merge用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 Finding frequent items for columns, possibly with false positives。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。