当前位置: 首页>>编程示例 >>用法及示例精选 >>正文


R SparkR unionByName用法及代码示例

说明:

返回一个新的 SparkDataFrame,其中包含此 SparkDataFrame 和另一个 SparkDataFrame 中的行的联合。这与union 函数不同,SQL 中的UNION ALLUNION DISTINCT 作为列位置都没有考虑在内。输入 SparkDataFrames 在模式中可以有不同的数据类型。

用法:

unionByName(x, y, ...)

## S4 method for signature 'SparkDataFrame,SparkDataFrame'
unionByName(x, y, allowMissingColumns = FALSE)

参数:

  • x 一个 SparkDataFrame
  • y 一个 SparkDataFrame
  • ... 要传递给其他方法或从其他方法传递的进一步参数。
  • allowMissingColumns 合乎逻辑的

细节:

当参数allowMissingColumns为'TRUE'时,x和y中的列名集合可以不同;缺少的列将被填充为空。此外,x 的缺失列将添加到联合结果模式的末尾。

注意:这不会删除两个 SparkDataFrame 中的重复行。此函数按名称(而不是按位置)解析列。

返回:

包含联合结果的 SparkDataFrame。

注意:

unionByName 自 2.3.0 起

例子:

sparkR.session()
df1 <- select(createDataFrame(mtcars), "carb", "am", "gear")
df2 <- select(createDataFrame(mtcars), "am", "gear", "carb")
head(unionByName(df1, df2))

df3 <- select(createDataFrame(mtcars), "carb")
head(unionByName(df1, df3, allowMissingColumns = TRUE))

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 Return a new SparkDataFrame containing the union of rows, matched by column names。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。