當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R SparkR summarize用法及代碼示例


說明:

在整個 SparkDataFrame 上聚合,沒有組。生成的 SparkDataFrame 還將包含分組列。

通過指定列列表計算聚合

用法:

agg(x, ...)

summarize(x, ...)

## S4 method for signature 'GroupedData'
agg(x, ...)

## S4 method for signature 'GroupedData'
summarize(x, ...)

## S4 method for signature 'SparkDataFrame'
agg(x, ...)

## S4 method for signature 'SparkDataFrame'
summarize(x, ...)

參數:

  • x SparkDataFrame 或 GroupedData。
  • ... 要傳遞給其他方法或從其他方法傳遞的進一步參數。

細節:

df2 <- agg(df, <column> = <aggFunction>) df2 <- agg(df, newColName = aggFunction(column))

返回:

一個 SparkDataFrame。

注意:

從 1.4.0 開始的 agg

從 1.4.0 開始總結

從 1.4.0 開始的 agg

從 1.4.0 開始總結

例子:

df2 <- agg(df, age = "sum")  # new column name will be created as 'SUM(age#0)'
 df3 <- agg(df, ageSum = sum(df$age)) # Creates a new column named ageSum
 df4 <- summarize(df, ageSum = max(df$age))

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 summarize。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。