说明:
返回一个新的 SparkDataFrame,其中包含此 SparkDataFrame 和另一个 SparkDataFrame 中的行的联合。这与union
函数不同,SQL 中的UNION ALL
和UNION DISTINCT
作为列位置都没有考虑在内。输入 SparkDataFrames 在模式中可以有不同的数据类型。
用法:
unionByName(x, y, ...)
## S4 method for signature 'SparkDataFrame,SparkDataFrame'
unionByName(x, y, allowMissingColumns = FALSE)
参数:
x
一个 SparkDataFramey
一个 SparkDataFrame...
要传递给其他方法或从其他方法传递的进一步参数。allowMissingColumns
合乎逻辑的
细节:
当参数allowMissingColumns为'TRUE'时,x和y中的列名集合可以不同;缺少的列将被填充为空。此外,x 的缺失列将添加到联合结果模式的末尾。
注意:这不会删除两个 SparkDataFrame 中的重复行。此函数按名称(而不是按位置)解析列。
返回:
包含联合结果的 SparkDataFrame。
注意:
unionByName 自 2.3.0 起
例子:
sparkR.session()
df1 <- select(createDataFrame(mtcars), "carb", "am", "gear")
df2 <- select(createDataFrame(mtcars), "am", "gear", "carb")
head(unionByName(df1, df2))
df3 <- select(createDataFrame(mtcars), "carb")
head(unionByName(df1, df3, allowMissingColumns = TRUE))
相关用法
- R SparkR union用法及代码示例
- R SparkR unionAll用法及代码示例
- R SparkR unpersist用法及代码示例
- R SparkR uncacheTable用法及代码示例
- R matrix转list用法及代码示例
- R SparkR freqItems用法及代码示例
- R SparkR intersectAll用法及代码示例
- R SparkR spark.decisionTree用法及代码示例
- R SparkR sparkR.callJMethod用法及代码示例
- R SparkR sample用法及代码示例
- R SparkR approxQuantile用法及代码示例
- R SparkR glm用法及代码示例
- R SparkR randomSplit用法及代码示例
- R SparkR describe用法及代码示例
- R SparkR withColumn用法及代码示例
- R SparkR read.stream用法及代码示例
- R SparkR join用法及代码示例
- R SparkR rbind用法及代码示例
- R SparkR windowPartitionBy用法及代码示例
- R SparkR count用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 Return a new SparkDataFrame containing the union of rows, matched by column names。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。