说明:
使用随机种子返回此 SparkDataFrame 的采样子集。注意:这不能保证准确提供给定 SparkDataFrame 总数中指定的分数。
用法:
sample(x, withReplacement = FALSE, fraction, seed)
sample_frac(x, withReplacement = FALSE, fraction, seed)
## S4 method for signature 'SparkDataFrame'
sample(x, withReplacement = FALSE, fraction, seed)
## S4 method for signature 'SparkDataFrame'
sample_frac(x, withReplacement = FALSE, fraction, seed)
参数:
x
一个 SparkDataFramewithReplacement
是否更换取样fraction
(粗略)样本目标分数seed
随机性种子值。默认是随机种子。
注意:
自 1.4.0 起的示例
sample_frac 从 1.4.0 开始
例子:
sparkR.session()
path <- "path/to/file.json"
df <- read.json(path)
collect(sample(df, fraction = 0.5))
collect(sample(df, FALSE, 0.5))
collect(sample(df, TRUE, 0.5, seed = 3))
相关用法
- R SparkR sampleBy用法及代码示例
- R SparkR saveAsTable用法及代码示例
- R SparkR spark.decisionTree用法及代码示例
- R SparkR sparkR.callJMethod用法及代码示例
- R SparkR str用法及代码示例
- R SparkR spark.powerIterationClustering用法及代码示例
- R SparkR spark.svmLinear用法及代码示例
- R SparkR spark.gaussianMixture用法及代码示例
- R SparkR storageLevel用法及代码示例
- R SparkR structField用法及代码示例
- R SparkR sparkR.newJObject用法及代码示例
- R SparkR spark.naiveBayes用法及代码示例
- R SparkR sparkR.version用法及代码示例
- R SparkR spark.getSparkFiles用法及代码示例
- R SparkR setLogLevel用法及代码示例
- R SparkR subset用法及代码示例
- R SparkR spark.survreg用法及代码示例
- R SparkR sparkR.session用法及代码示例
- R SparkR selectExpr用法及代码示例
- R SparkR spark.lm用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 Sample。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。