說明:
根據給定的連接表達式連接兩個 SparkDataFrame。
用法:
## S4 method for signature 'SparkDataFrame,SparkDataFrame'
join(x, y, joinExpr = NULL, joinType = NULL)
參數:
x
一個 SparkDataFramey
一個 SparkDataFramejoinExpr
(可選)用於執行連接的表達式。 joinExpr 必須是 Column 表達式。如果省略 joinExpr,則嘗試默認的內連接,如果它是笛卡爾積,則會引發錯誤。對於笛卡爾連接,請改用 crossJoin。joinType
要執行的連接類型,默認為'inner'。必須是以下之一:'inner', 'cross', 'outer', 'full', 'fullouter', 'full_outer', 'left', 'leftouter', 'left_outer', 'right', 'rightouter', 'right_outer', 'semi', 'leftsemi', 'left_semi', 'anti', 'leftanti', 'left_anti'。
返回:
包含連接操作結果的 SparkDataFrame。
注意:
從 1.4.0 開始加入
例子:
sparkR.session()
df1 <- read.json(path)
df2 <- read.json(path2)
join(df1, df2, df1$col1 == df2$col2) # Performs an inner join based on expression
join(df1, df2, df1$col1 == df2$col2, "right_outer")
join(df1, df2) # Attempts an inner join
相關用法
- R matrix轉list用法及代碼示例
- R SparkR freqItems用法及代碼示例
- R SparkR intersectAll用法及代碼示例
- R SparkR spark.decisionTree用法及代碼示例
- R SparkR sparkR.callJMethod用法及代碼示例
- R SparkR sample用法及代碼示例
- R SparkR approxQuantile用法及代碼示例
- R SparkR glm用法及代碼示例
- R SparkR randomSplit用法及代碼示例
- R SparkR describe用法及代碼示例
- R SparkR withColumn用法及代碼示例
- R SparkR read.stream用法及代碼示例
- R SparkR rbind用法及代碼示例
- R SparkR windowPartitionBy用法及代碼示例
- R SparkR count用法及代碼示例
- R SparkR column用法及代碼示例
- R SparkR merge用法及代碼示例
- R SparkR str用法及代碼示例
- R SparkR hint用法及代碼示例
- R SparkR windowOrderBy用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 Join。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。