R SparkR unionByName用法及代碼示例

說明：

返回一個新的 SparkDataFrame，其中包含此 SparkDataFrame 和另一個 SparkDataFrame 中的行的聯合。這與union 函數不同，SQL 中的UNION ALL 和UNION DISTINCT 作為列位置都沒有考慮在內。輸入 SparkDataFrames 在模式中可以有不同的數據類型。

用法：

unionByName(x, y, ...)

## S4 method for signature 'SparkDataFrame,SparkDataFrame'
unionByName(x, y, allowMissingColumns = FALSE)

參數：

x 一個 SparkDataFrame
y 一個 SparkDataFrame
... 要傳遞給其他方法或從其他方法傳遞的進一步參數。
allowMissingColumns 合乎邏輯的

細節：

當參數allowMissingColumns為'TRUE'時，x和y中的列名集合可以不同；缺少的列將被填充為空。此外，x 的缺失列將添加到聯合結果模式的末尾。

注意：這不會刪除兩個 SparkDataFrame 中的重複行。此函數按名稱(而不是按位置)解析列。

包含聯合結果的 SparkDataFrame。

注意：

unionByName 自 2.3.0 起

例子：

sparkR.session()
df1 <- select(createDataFrame(mtcars), "carb", "am", "gear")
df2 <- select(createDataFrame(mtcars), "am", "gear", "carb")
head(unionByName(df1, df2))

df3 <- select(createDataFrame(mtcars), "carb")
head(unionByName(df1, df3, allowMissingColumns = TRUE))

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 Return a new SparkDataFrame containing the union of rows, matched by column names。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

說明：

用法：

參數：

細節：

返回：

注意：

例子：