R SparkR sampleBy用法及代碼示例

根據每個層上給出的分數返回分層樣本而不進行替換。

sampleBy(x, col, fractions, seed)

## S4 method for signature 'SparkDataFrame,character,list,numeric'
sampleBy(x, col, fractions, seed)

代表分層樣本的新 SparkDataFrame

sampleBy 自 1.6.0

df <- read.json("/path/to/file.json")
sample <- sampleBy(df, "key", fractions, 36)

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 Returns a stratified sample without replacement。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。