當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python dask.array.store用法及代碼示例


用法:

dask.array.store(sources: Array | Collection[Array], targets, lock: bool | Lock = True, regions: tuple[slice, ...] | Collection[tuple[slice, ...]] | None = None, compute: bool = True, return_stored: bool = False, **kwargs)

將 dask 數組存儲在 array-like 對象中,覆蓋目標中的數據

這會將 dask 數組存儲到支持 numpy 樣式的 setitem 索引的對象中。它逐塊存儲值,因此不必填滿內存。為了獲得最佳性能,您可以將存儲目標的塊大小與陣列的塊大小對齊。

如果您的數據適合內存,那麽您可能更喜歡調用np.array(myarray)

參數

sources: Array or collection of Arrays
targets: array-like or Delayed or collection of array-likes and/or Delayeds

這些應該支持 setitem 語法target[10:20] = ...

lock: boolean or threading.Lock, optional

存儲時是否鎖定數據存儲。傳遞 True(單獨鎖定每個文件)、False(不鎖定)或要在所有寫入之間共享的特定 threading.Lock 對象。

regions: tuple of slices or collection of tuples of slices

regions 中的每個 region 元組應該使得 target[region].shape = source.shape 分別用於源和目標中的相應源和目標。如果這是一個元組,則內容將被假定為切片,因此不要提供元組的元組。

compute: boolean, optional

如果為真則立即計算;否則返回dask.delayed.Delayed

return_stored: boolean, optional

可選擇返回存儲的結果(默認為 False)。

kwargs:

傳遞給計算/持久化的參數(僅在計算=真時使用)

返回

如果return_stored=真

數組元組

如果return_stored=False 並且計算=True

None

如果return_stored=False 並且計算=False

延遲

例子

>>> import h5py  
>>> f = h5py.File('myfile.hdf5', mode='a')  
>>> dset = f.create_dataset('/data', shape=x.shape,
...                                  chunks=x.chunks,
...                                  dtype='f8')
>>> store(x, dset)

或者同時存儲多個數組

>>> store([x, y, z], [dset1, dset2, dset3])

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.array.store。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。