说明:
根据每个层上给出的分数返回分层样本而不进行替换。
用法:
sampleBy(x, col, fractions, seed)
## S4 method for signature 'SparkDataFrame,character,list,numeric'
sampleBy(x, col, fractions, seed)
参数:
x
一个 SparkDataFramecol
定义层的列fractions
一个命名列表,给出每个层的采样分数。如果未指定层,我们将其分数视为零。seed
随机种子
返回:
代表分层样本的新 SparkDataFrame
注意:
sampleBy 自 1.6.0
例子:
df <- read.json("/path/to/file.json")
sample <- sampleBy(df, "key", fractions, 36)
相关用法
- R SparkR sample用法及代码示例
- R SparkR saveAsTable用法及代码示例
- R SparkR spark.decisionTree用法及代码示例
- R SparkR sparkR.callJMethod用法及代码示例
- R SparkR str用法及代码示例
- R SparkR spark.powerIterationClustering用法及代码示例
- R SparkR spark.svmLinear用法及代码示例
- R SparkR spark.gaussianMixture用法及代码示例
- R SparkR storageLevel用法及代码示例
- R SparkR structField用法及代码示例
- R SparkR sparkR.newJObject用法及代码示例
- R SparkR spark.naiveBayes用法及代码示例
- R SparkR sparkR.version用法及代码示例
- R SparkR spark.getSparkFiles用法及代码示例
- R SparkR setLogLevel用法及代码示例
- R SparkR subset用法及代码示例
- R SparkR spark.survreg用法及代码示例
- R SparkR sparkR.session用法及代码示例
- R SparkR selectExpr用法及代码示例
- R SparkR spark.lm用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 Returns a stratified sample without replacement。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。