說明:
數據源由source
和一組選項 (...) 指定。如果不指定source
,則使用spark.sql.sources.default配置的默認數據源。
用法:
write.df(df, path = NULL, ...)
saveDF(df, path, source = NULL, mode = "error", ...)
write.df(df, path = NULL, ...)
## S4 method for signature 'SparkDataFrame'
write.df(
df,
path = NULL,
source = NULL,
mode = "error",
partitionBy = NULL,
...
)
## S4 method for signature 'SparkDataFrame,character'
saveDF(df, path, source = NULL, mode = "error", ...)
參數:
df
一個 SparkDataFrame。path
表的名稱。...
傳遞給方法的附加參數。source
外部數據源的名稱。mode
'append', 'overwrite', 'error', 'errorifexists', 'ignore'保存模式之一(默認為'error')partitionBy
用於在文件係統上對輸出進行分區的名稱或列名稱列表。如果指定,則輸出布局在文件係統上,類似於 Hive 的分區方案。
細節:
此外,模式用於指定數據源中已存在數據時保存操作的行為。有四種模式:
'append':此 SparkDataFrame 的內容應附加到現有數據中。
'overwrite':現有數據預計將被此 SparkDataFrame 的內容覆蓋。
'error' 或'errorifexists':預計會拋出異常。
'ignore':保存操作預計不會保存 SparkDataFrame 的內容,也不會更改現有數據。
注意:
write.df 從 1.4.0 開始
saveDF 從 1.4.0 開始
例子:
sparkR.session()
path <- "path/to/file.json"
df <- read.json(path)
write.df(df, "myfile", "parquet", "overwrite", partitionBy = c("col1", "col2"))
saveDF(df, parquetPath2, "parquet", mode = "append", mergeSchema = TRUE)
相關用法
- R SparkR write.json用法及代碼示例
- R SparkR write.parquet用法及代碼示例
- R SparkR write.orc用法及代碼示例
- R SparkR write.stream用法及代碼示例
- R SparkR write.jdbc用法及代碼示例
- R SparkR write.text用法及代碼示例
- R SparkR withColumn用法及代碼示例
- R SparkR windowPartitionBy用法及代碼示例
- R SparkR windowOrderBy用法及代碼示例
- R SparkR with用法及代碼示例
- R SparkR withWatermark用法及代碼示例
- R SparkR withField用法及代碼示例
- R matrix轉list用法及代碼示例
- R SparkR freqItems用法及代碼示例
- R SparkR intersectAll用法及代碼示例
- R SparkR spark.decisionTree用法及代碼示例
- R SparkR sparkR.callJMethod用法及代碼示例
- R SparkR sample用法及代碼示例
- R SparkR approxQuantile用法及代碼示例
- R SparkR glm用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 Save the contents of SparkDataFrame to a data source.。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。