當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


R SparkR dapplyCollect用法及代碼示例

說明:

將函數應用於 SparkDataFrame 的每個分區,並將結果作為 data.frame 收集回 R。

用法:

dapplyCollect(x, func)

## S4 method for signature 'SparkDataFrame,'function''
dapplyCollect(x, func)

參數:

  • x 一個 SparkDataFrame
  • func 要應用於 SparkDataFrame 的每個分區的函數。 func 應該隻有一個參數,每個分區對應的 R data.frame 將被傳遞給該參數。 func 的輸出應該是一個 R data.frame。

注意:

dapplyCollect 從 2.0.0 開始

例子:

df <- createDataFrame(iris)
  ldf <- dapplyCollect(df, function(x) { x })

  # filter and add a column
  df <- createDataFrame(
          list(list(1L, 1, "1"), list(2L, 2, "2"), list(3L, 3, "3")),
          c("a", "b", "c"))
  ldf <- dapplyCollect(
           df,
           function(x) {
             y <- x[x[1] > 1, ]
             y <- cbind(y, y[1] + 1L)
           })
  # the result
  #       a b c d
  #       2 2 2 3
  #       3 3 3 4

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 dapplyCollect。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。