当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R SparkR sample用法及代码示例


说明:

使用随机种子返回此 SparkDataFrame 的采样子集。注意:这不能保证准确提供给定 SparkDataFrame 总数中指定的分数。

用法:

sample(x, withReplacement = FALSE, fraction, seed)

sample_frac(x, withReplacement = FALSE, fraction, seed)

## S4 method for signature 'SparkDataFrame'
sample(x, withReplacement = FALSE, fraction, seed)

## S4 method for signature 'SparkDataFrame'
sample_frac(x, withReplacement = FALSE, fraction, seed)

参数:

  • x 一个 SparkDataFrame
  • withReplacement 是否更换取样
  • fraction (粗略)样本目标分数
  • seed 随机性种子值。默认是随机种子。

注意:

自 1.4.0 起的示例

sample_frac 从 1.4.0 开始

例子:

sparkR.session()
path <- "path/to/file.json"
df <- read.json(path)
collect(sample(df, fraction = 0.5))
collect(sample(df, FALSE, 0.5))
collect(sample(df, TRUE, 0.5, seed = 3))

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 Sample。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。