Python pyspark DataFrame.randomSplit用法及代碼示例

本文簡要介紹 pyspark.sql.DataFrame.randomSplit 的用法。

用法: DataFrame.randomSplit(weights, seed=None)

使用提供的權重隨機拆分此 DataFrame 。

1.4.0 版中的新函數。

>>> splits = df4.randomSplit([1.0, 2.0], 24)
>>> splits[0].count()
2

>>> splits[1].count()
2

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.DataFrame.randomSplit。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。