说明:
在整个 SparkDataFrame 上聚合,没有组。生成的 SparkDataFrame 还将包含分组列。
通过指定列列表计算聚合
用法:
agg(x, ...)
summarize(x, ...)
## S4 method for signature 'GroupedData'
agg(x, ...)
## S4 method for signature 'GroupedData'
summarize(x, ...)
## S4 method for signature 'SparkDataFrame'
agg(x, ...)
## S4 method for signature 'SparkDataFrame'
summarize(x, ...)
参数:
x
SparkDataFrame 或 GroupedData。...
要传递给其他方法或从其他方法传递的进一步参数。
细节:
df2 <- agg(df, <column> = <aggFunction>) df2 <- agg(df, newColName = aggFunction(column))
返回:
一个 SparkDataFrame。
注意:
从 1.4.0 开始的 agg
从 1.4.0 开始总结
从 1.4.0 开始的 agg
从 1.4.0 开始总结
例子:
df2 <- agg(df, age = "sum") # new column name will be created as 'SUM(age#0)'
df3 <- agg(df, ageSum = sum(df$age)) # Creates a new column named ageSum
df4 <- summarize(df, ageSum = max(df$age))
相关用法
- R SparkR summary用法及代码示例
- R SparkR subset用法及代码示例
- R SparkR substr用法及代码示例
- R SparkR spark.decisionTree用法及代码示例
- R SparkR sparkR.callJMethod用法及代码示例
- R SparkR sample用法及代码示例
- R SparkR str用法及代码示例
- R SparkR spark.powerIterationClustering用法及代码示例
- R SparkR spark.svmLinear用法及代码示例
- R SparkR spark.gaussianMixture用法及代码示例
- R SparkR storageLevel用法及代码示例
- R SparkR structField用法及代码示例
- R SparkR sparkR.newJObject用法及代码示例
- R SparkR spark.naiveBayes用法及代码示例
- R SparkR sparkR.version用法及代码示例
- R SparkR spark.getSparkFiles用法及代码示例
- R SparkR setLogLevel用法及代码示例
- R SparkR spark.survreg用法及代码示例
- R SparkR sparkR.session用法及代码示例
- R SparkR selectExpr用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 summarize。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。