當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R SparkR withColumn用法及代碼示例


說明:

通過添加列或替換具有相同名稱的現有列來返回新的 SparkDataFrame。

用法:

withColumn(x, colName, col)

## S4 method for signature 'SparkDataFrame,character'
withColumn(x, colName, col)

參數:

  • x 一個 SparkDataFrame。
  • colName 列名。
  • col 一個列表達式(它必須隻引用這個 SparkDataFrame),或者一個長度為 1 的原子向量作為文字值。

細節:

注意:此方法在內部引入了投影。因此,多次調用它,例如,通過循環以添加多個列可能會生成可能導致性能問題甚至 StackOverflowException 的大計劃。為避免這種情況,請同時對多列使用select

返回:

添加了新列或替換了現有列的 SparkDataFrame。

注意:

withColumn 自 1.4.0 起

例子:

sparkR.session()
path <- "path/to/file.json"
df <- read.json(path)
newDF <- withColumn(df, "newCol", df$col1 * 5)
# Replace an existing column
newDF2 <- withColumn(newDF, "newCol", newDF$col1)
newDF3 <- withColumn(newDF, "newCol", 42)
# Use extract operator to set an existing or new column
df[["age"]] <- 23
df[[2]] <- df$col1
df[[2]] <- NULL # drop column

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 WithColumn。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。