当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R SparkR dapplyCollect用法及代码示例


说明:

将函数应用于 SparkDataFrame 的每个分区,并将结果作为 data.frame 收集回 R。

用法:

dapplyCollect(x, func)

## S4 method for signature 'SparkDataFrame,'function''
dapplyCollect(x, func)

参数:

  • x 一个 SparkDataFrame
  • func 要应用于 SparkDataFrame 的每个分区的函数。 func 应该只有一个参数,每个分区对应的 R data.frame 将被传递给该参数。 func 的输出应该是一个 R data.frame。

注意:

dapplyCollect 从 2.0.0 开始

例子:

df <- createDataFrame(iris)
  ldf <- dapplyCollect(df, function(x) { x })

  # filter and add a column
  df <- createDataFrame(
          list(list(1L, 1, "1"), list(2L, 2, "2"), list(3L, 3, "3")),
          c("a", "b", "c"))
  ldf <- dapplyCollect(
           df,
           function(x) {
             y <- x[x[1] > 1, ]
             y <- cbind(y, y[1] + 1L)
           })
  # the result
  #       a b c d
  #       2 2 2 3
  #       3 3 3 4

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 dapplyCollect。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。