当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R SparkR withColumn用法及代码示例


说明:

通过添加列或替换具有相同名称的现有列来返回新的 SparkDataFrame。

用法:

withColumn(x, colName, col)

## S4 method for signature 'SparkDataFrame,character'
withColumn(x, colName, col)

参数:

  • x 一个 SparkDataFrame。
  • colName 列名。
  • col 一个列表达式(它必须只引用这个 SparkDataFrame),或者一个长度为 1 的原子向量作为文字值。

细节:

注意:此方法在内部引入了投影。因此,多次调用它,例如,通过循环以添加多个列可能会生成可能导致性能问题甚至 StackOverflowException 的大计划。为避免这种情况,请同时对多列使用select

返回:

添加了新列或替换了现有列的 SparkDataFrame。

注意:

withColumn 自 1.4.0 起

例子:

sparkR.session()
path <- "path/to/file.json"
df <- read.json(path)
newDF <- withColumn(df, "newCol", df$col1 * 5)
# Replace an existing column
newDF2 <- withColumn(newDF, "newCol", newDF$col1)
newDF3 <- withColumn(newDF, "newCol", 42)
# Use extract operator to set an existing or new column
df[["age"]] <- 23
df[[2]] <- df$col1
df[[2]] <- NULL # drop column

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 WithColumn。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。