用法:
DataFrame.random_split(frac, random_state=None, shuffle=False)
伪随机地将数据帧按行分成不同的部分
- frac:列表
总和为 1 的浮点数列表。
- random_state:int 或 np.random.RandomState
如果 int 以此为种子创建一个新的 RandomState。否则从传递的 RandomState 中提取。
- shuffle:布尔值,默认为 False
如果设置为 True,则数据帧在拆分之前会被打乱(在分区内)。
参数:
例子:
50/50 分割
>>> a, b = df.random_split([0.5, 0.5])
80/10/10 拆分,一致 random_state
>>> a, b, c = df.random_split([0.8, 0.1, 0.1], random_state=123)
相关用法
- Python dask.dataframe.DataFrame.radd用法及代码示例
- Python dask.dataframe.DataFrame.round用法及代码示例
- Python dask.dataframe.DataFrame.rmul用法及代码示例
- Python dask.dataframe.DataFrame.rmod用法及代码示例
- Python dask.dataframe.DataFrame.resample用法及代码示例
- Python dask.dataframe.DataFrame.rfloordiv用法及代码示例
- Python dask.dataframe.DataFrame.rename用法及代码示例
- Python dask.dataframe.DataFrame.rpow用法及代码示例
- Python dask.dataframe.DataFrame.replace用法及代码示例
- Python dask.dataframe.DataFrame.repartition用法及代码示例
- Python dask.dataframe.DataFrame.rtruediv用法及代码示例
- Python dask.dataframe.DataFrame.rdiv用法及代码示例
- Python dask.dataframe.DataFrame.rsub用法及代码示例
- Python dask.dataframe.DataFrame.applymap用法及代码示例
- Python dask.dataframe.DataFrame.sub用法及代码示例
- Python dask.dataframe.DataFrame.mod用法及代码示例
- Python dask.dataframe.DataFrame.cummin用法及代码示例
- Python dask.dataframe.DataFrame.truediv用法及代码示例
- Python dask.dataframe.DataFrame.ne用法及代码示例
- Python dask.dataframe.DataFrame.partitions用法及代码示例
注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.DataFrame.random_split。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。