當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R SparkR sample用法及代碼示例


說明:

使用隨機種子返回此 SparkDataFrame 的采樣子集。注意:這不能保證準確提供給定 SparkDataFrame 總數中指定的分數。

用法:

sample(x, withReplacement = FALSE, fraction, seed)

sample_frac(x, withReplacement = FALSE, fraction, seed)

## S4 method for signature 'SparkDataFrame'
sample(x, withReplacement = FALSE, fraction, seed)

## S4 method for signature 'SparkDataFrame'
sample_frac(x, withReplacement = FALSE, fraction, seed)

參數:

  • x 一個 SparkDataFrame
  • withReplacement 是否更換取樣
  • fraction (粗略)樣本目標分數
  • seed 隨機性種子值。默認是隨機種子。

注意:

自 1.4.0 起的示例

sample_frac 從 1.4.0 開始

例子:

sparkR.session()
path <- "path/to/file.json"
df <- read.json(path)
collect(sample(df, fraction = 0.5))
collect(sample(df, FALSE, 0.5))
collect(sample(df, TRUE, 0.5, seed = 3))

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 Sample。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。