R SparkR summarize用法及代碼示例

說明：

在整個 SparkDataFrame 上聚合，沒有組。生成的 SparkDataFrame 還將包含分組列。

通過指定列列表計算聚合

用法：

agg(x, ...)

summarize(x, ...)

## S4 method for signature 'GroupedData'
agg(x, ...)

## S4 method for signature 'GroupedData'
summarize(x, ...)

## S4 method for signature 'SparkDataFrame'
agg(x, ...)

## S4 method for signature 'SparkDataFrame'
summarize(x, ...)

參數：

x SparkDataFrame 或 GroupedData。
... 要傳遞給其他方法或從其他方法傳遞的進一步參數。

細節：

df2 <- agg(df, <column> = <aggFunction>) df2 <- agg(df, newColName = aggFunction(column))

一個 SparkDataFrame。

注意：

從 1.4.0 開始的 agg

從 1.4.0 開始總結

從 1.4.0 開始的 agg

從 1.4.0 開始總結

例子：

df2 <- agg(df, age = "sum")  # new column name will be created as 'SUM(age#0)'
 df3 <- agg(df, ageSum = sum(df$age)) # Creates a new column named ageSum
 df4 <- summarize(df, ageSum = max(df$age))

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 summarize。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

說明：

用法：

參數：

細節：

返回：

注意：

例子：