用法:
dask.bag.from_sequence(seq, partition_size=None, npartitions=None)
从 Python 序列创建一个 dask Bag。
这个序列在内存中应该是比较小的。 Dask Bag 在处理自己的数据加载时效果最佳。通常我们将一系列文件名加载到 Bag 中,然后使用
.map
打开它们。- seq: Iterable:
要放入 dask 的一系列元素
- partition_size: int (optional):
每个分区的长度
- npartitions: int (optional):
所需分区数
- It is best to provide either ``partition_size`` or ``npartitions``:
- (though not both.):
参数:
例子:
>>> import dask.bag as db >>> b = db.from_sequence(['Alice', 'Bob', 'Chuck'], partition_size=2)
相关用法
- Python dask.bag.from_url用法及代码示例
- Python dask.bag.from_delayed用法及代码示例
- Python dask.bag.Bag.frequencies用法及代码示例
- Python dask.bag.Bag.to_textfiles用法及代码示例
- Python dask.bag.Bag.repartition用法及代码示例
- Python dask.bag.Bag.join用法及代码示例
- Python dask.bag.Bag.accumulate用法及代码示例
- Python dask.bag.Bag.fold用法及代码示例
- Python dask.bag.Bag.map_partitions用法及代码示例
- Python dask.bag.Bag.groupby用法及代码示例
- Python dask.bag.map用法及代码示例
- Python dask.bag.Bag.reduction用法及代码示例
- Python dask.bag.Bag.foldby用法及代码示例
- Python dask.bag.range用法及代码示例
- Python dask.bag.Bag.flatten用法及代码示例
- Python dask.bag.random.sample用法及代码示例
- Python dask.bag.Bag.remove用法及代码示例
- Python dask.bag.Bag.random_sample用法及代码示例
- Python dask.bag.random.choices用法及代码示例
- Python dask.bag.Item.visualize用法及代码示例
注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.bag.from_sequence。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。