當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R SparkR randomSplit用法及代碼示例


說明:

返回具有提供的權重的隨機拆分數據幀列表。

用法:

randomSplit(x, weights, seed)

## S4 method for signature 'SparkDataFrame,numeric'
randomSplit(x, weights, seed)

參數:

  • x 一個 SparkDataFrame
  • weights 分割的權重向量,如果它們的總和不為 1,將被歸一化
  • seed 用於隨機分裂的種子

注意:

從 2.0.0 開始的 randomSplit

例子:

sparkR.session()
df <- createDataFrame(data.frame(id = 1:1000))
df_list <- randomSplit(df, c(2, 3, 5), 0)
# df_list contains 3 SparkDataFrames with each having about 200, 300 and 500 rows respectively
sapply(df_list, count)

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 randomSplit。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。