當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python dask.bag.from_sequence用法及代碼示例

用法:

dask.bag.from_sequence(seq, partition_size=None, npartitions=None)

從 Python 序列創建一個 dask Bag。

這個序列在內存中應該是比較小的。 Dask Bag 在處理自己的數據加載時效果最佳。通常我們將一係列文件名加載到 Bag 中,然後使用.map 打開它們。

參數

seq: Iterable

要放入 dask 的一係列元素

partition_size: int (optional)

每個分區的長度

npartitions: int (optional)

所需分區數

It is best to provide either ``partition_size`` or ``npartitions``
(though not both.)

例子

>>> import dask.bag as db
>>> b = db.from_sequence(['Alice', 'Bob', 'Chuck'], partition_size=2)

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.bag.from_sequence。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。