Python pyspark DataFrame.randomSplit用法及代码示例

本文简要介绍 pyspark.sql.DataFrame.randomSplit 的用法。

用法: DataFrame.randomSplit(weights, seed=None)

使用提供的权重随机拆分此 DataFrame 。

1.4.0 版中的新函数。

>>> splits = df4.randomSplit([1.0, 2.0], 24)
>>> splits[0].count()
2

>>> splits[1].count()
2

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrame.randomSplit。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。