R SparkR unionByName用法及代码示例

说明：

返回一个新的 SparkDataFrame，其中包含此 SparkDataFrame 和另一个 SparkDataFrame 中的行的联合。这与union 函数不同，SQL 中的UNION ALL 和UNION DISTINCT 作为列位置都没有考虑在内。输入 SparkDataFrames 在模式中可以有不同的数据类型。

用法：

unionByName(x, y, ...)

## S4 method for signature 'SparkDataFrame,SparkDataFrame'
unionByName(x, y, allowMissingColumns = FALSE)

参数：

x 一个 SparkDataFrame
y 一个 SparkDataFrame
... 要传递给其他方法或从其他方法传递的进一步参数。
allowMissingColumns 合乎逻辑的

细节：

当参数allowMissingColumns为'TRUE'时，x和y中的列名集合可以不同；缺少的列将被填充为空。此外，x 的缺失列将添加到联合结果模式的末尾。

注意：这不会删除两个 SparkDataFrame 中的重复行。此函数按名称(而不是按位置)解析列。

包含联合结果的 SparkDataFrame。

注意：

unionByName 自 2.3.0 起

例子：

sparkR.session()
df1 <- select(createDataFrame(mtcars), "carb", "am", "gear")
df2 <- select(createDataFrame(mtcars), "am", "gear", "carb")
head(unionByName(df1, df2))

df3 <- select(createDataFrame(mtcars), "carb")
head(unionByName(df1, df3, allowMissingColumns = TRUE))

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 Return a new SparkDataFrame containing the union of rows, matched by column names。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

说明：

用法：

参数：

细节：

返回：

注意：

例子：