R SparkR summarize用法及代码示例

说明：

在整个 SparkDataFrame 上聚合，没有组。生成的 SparkDataFrame 还将包含分组列。

通过指定列列表计算聚合

用法：

agg(x, ...)

summarize(x, ...)

## S4 method for signature 'GroupedData'
agg(x, ...)

## S4 method for signature 'GroupedData'
summarize(x, ...)

## S4 method for signature 'SparkDataFrame'
agg(x, ...)

## S4 method for signature 'SparkDataFrame'
summarize(x, ...)

参数：

x SparkDataFrame 或 GroupedData。
... 要传递给其他方法或从其他方法传递的进一步参数。

细节：

df2 <- agg(df, <column> = <aggFunction>) df2 <- agg(df, newColName = aggFunction(column))

一个 SparkDataFrame。

注意：

从 1.4.0 开始的 agg

从 1.4.0 开始总结

从 1.4.0 开始的 agg

从 1.4.0 开始总结

例子：

df2 <- agg(df, age = "sum")  # new column name will be created as 'SUM(age#0)'
 df3 <- agg(df, ageSum = sum(df$age)) # Creates a new column named ageSum
 df4 <- summarize(df, ageSum = max(df$age))

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 summarize。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

说明：

用法：

参数：

细节：

返回：

注意：

例子：