当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R SparkR summarize用法及代码示例


说明:

在整个 SparkDataFrame 上聚合,没有组。生成的 SparkDataFrame 还将包含分组列。

通过指定列列表计算聚合

用法:

agg(x, ...)

summarize(x, ...)

## S4 method for signature 'GroupedData'
agg(x, ...)

## S4 method for signature 'GroupedData'
summarize(x, ...)

## S4 method for signature 'SparkDataFrame'
agg(x, ...)

## S4 method for signature 'SparkDataFrame'
summarize(x, ...)

参数:

  • x SparkDataFrame 或 GroupedData。
  • ... 要传递给其他方法或从其他方法传递的进一步参数。

细节:

df2 <- agg(df, <column> = <aggFunction>) df2 <- agg(df, newColName = aggFunction(column))

返回:

一个 SparkDataFrame。

注意:

从 1.4.0 开始的 agg

从 1.4.0 开始总结

从 1.4.0 开始的 agg

从 1.4.0 开始总结

例子:

df2 <- agg(df, age = "sum")  # new column name will be created as 'SUM(age#0)'
 df3 <- agg(df, ageSum = sum(df$age)) # Creates a new column named ageSum
 df4 <- summarize(df, ageSum = max(df$age))

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 summarize。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。