當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


R SparkR unionByName用法及代碼示例

說明:

返回一個新的 SparkDataFrame,其中包含此 SparkDataFrame 和另一個 SparkDataFrame 中的行的聯合。這與union 函數不同,SQL 中的UNION ALLUNION DISTINCT 作為列位置都沒有考慮在內。輸入 SparkDataFrames 在模式中可以有不同的數據類型。

用法:

unionByName(x, y, ...)

## S4 method for signature 'SparkDataFrame,SparkDataFrame'
unionByName(x, y, allowMissingColumns = FALSE)

參數:

  • x 一個 SparkDataFrame
  • y 一個 SparkDataFrame
  • ... 要傳遞給其他方法或從其他方法傳遞的進一步參數。
  • allowMissingColumns 合乎邏輯的

細節:

當參數allowMissingColumns為'TRUE'時,x和y中的列名集合可以不同;缺少的列將被填充為空。此外,x 的缺失列將添加到聯合結果模式的末尾。

注意:這不會刪除兩個 SparkDataFrame 中的重複行。此函數按名稱(而不是按位置)解析列。

返回:

包含聯合結果的 SparkDataFrame。

注意:

unionByName 自 2.3.0 起

例子:

sparkR.session()
df1 <- select(createDataFrame(mtcars), "carb", "am", "gear")
df2 <- select(createDataFrame(mtcars), "am", "gear", "carb")
head(unionByName(df1, df2))

df3 <- select(createDataFrame(mtcars), "carb")
head(unionByName(df1, df3, allowMissingColumns = TRUE))

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 Return a new SparkDataFrame containing the union of rows, matched by column names。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。