当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.bag.from_sequence用法及代码示例


用法:

dask.bag.from_sequence(seq, partition_size=None, npartitions=None)

从 Python 序列创建一个 dask Bag。

这个序列在内存中应该是比较小的。 Dask Bag 在处理自己的数据加载时效果最佳。通常我们将一系列文件名加载到 Bag 中,然后使用.map 打开它们。

参数

seq: Iterable

要放入 dask 的一系列元素

partition_size: int (optional)

每个分区的长度

npartitions: int (optional)

所需分区数

It is best to provide either ``partition_size`` or ``npartitions``
(though not both.)

例子

>>> import dask.bag as db
>>> b = db.from_sequence(['Alice', 'Bob', 'Chuck'], partition_size=2)

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.bag.from_sequence。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。