說明:
返回刪除重複行的新 SparkDataFrame,僅考慮列的子集。
用法:
dropDuplicates(x, ...)
## S4 method for signature 'SparkDataFrame'
dropDuplicates(x, ...)
參數:
x
一個 SparkDataFrame。...
列名或字符串列名的字符向量。如果第一個參數包含字符向量,則忽略以下內容。
返回:
刪除了重複行的 SparkDataFrame。
注意:
從 2.0.0 開始刪除重複項
例子:
sparkR.session()
path <- "path/to/file.json"
df <- read.json(path)
dropDuplicates(df)
dropDuplicates(df, "col1", "col2")
dropDuplicates(df, c("col1", "col2"))
相關用法
- R SparkR dropFields用法及代碼示例
- R SparkR drop用法及代碼示例
- R SparkR dropTempView用法及代碼示例
- R SparkR dropTempTable用法及代碼示例
- R SparkR describe用法及代碼示例
- R SparkR dapplyCollect用法及代碼示例
- R SparkR dapply用法及代碼示例
- R SparkR distinct用法及代碼示例
- R SparkR dim用法及代碼示例
- R SparkR dtypes用法及代碼示例
- R matrix轉list用法及代碼示例
- R SparkR freqItems用法及代碼示例
- R SparkR intersectAll用法及代碼示例
- R SparkR spark.decisionTree用法及代碼示例
- R SparkR sparkR.callJMethod用法及代碼示例
- R SparkR sample用法及代碼示例
- R SparkR approxQuantile用法及代碼示例
- R SparkR glm用法及代碼示例
- R SparkR randomSplit用法及代碼示例
- R SparkR withColumn用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 dropDuplicates。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。