說明:
在整個 SparkDataFrame 上聚合,沒有組。生成的 SparkDataFrame 還將包含分組列。
通過指定列列表計算聚合
用法:
agg(x, ...)
summarize(x, ...)
## S4 method for signature 'GroupedData'
agg(x, ...)
## S4 method for signature 'GroupedData'
summarize(x, ...)
## S4 method for signature 'SparkDataFrame'
agg(x, ...)
## S4 method for signature 'SparkDataFrame'
summarize(x, ...)
參數:
x
SparkDataFrame 或 GroupedData。...
要傳遞給其他方法或從其他方法傳遞的進一步參數。
細節:
df2 <- agg(df, <column> = <aggFunction>) df2 <- agg(df, newColName = aggFunction(column))
返回:
一個 SparkDataFrame。
注意:
從 1.4.0 開始的 agg
從 1.4.0 開始總結
從 1.4.0 開始的 agg
從 1.4.0 開始總結
例子:
df2 <- agg(df, age = "sum") # new column name will be created as 'SUM(age#0)'
df3 <- agg(df, ageSum = sum(df$age)) # Creates a new column named ageSum
df4 <- summarize(df, ageSum = max(df$age))
相關用法
- R SparkR summary用法及代碼示例
- R SparkR subset用法及代碼示例
- R SparkR substr用法及代碼示例
- R SparkR spark.decisionTree用法及代碼示例
- R SparkR sparkR.callJMethod用法及代碼示例
- R SparkR sample用法及代碼示例
- R SparkR str用法及代碼示例
- R SparkR spark.powerIterationClustering用法及代碼示例
- R SparkR spark.svmLinear用法及代碼示例
- R SparkR spark.gaussianMixture用法及代碼示例
- R SparkR storageLevel用法及代碼示例
- R SparkR structField用法及代碼示例
- R SparkR sparkR.newJObject用法及代碼示例
- R SparkR spark.naiveBayes用法及代碼示例
- R SparkR sparkR.version用法及代碼示例
- R SparkR spark.getSparkFiles用法及代碼示例
- R SparkR setLogLevel用法及代碼示例
- R SparkR spark.survreg用法及代碼示例
- R SparkR sparkR.session用法及代碼示例
- R SparkR selectExpr用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 summarize。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。