當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python dask.dataframe.compute用法及代碼示例


用法:

dask.dataframe.compute(*args, traverse=True, optimize_graph=True, scheduler=None, get=None, **kwargs)

一次計算幾個 dask 集合。

參數

args對象

任意數量的對象。如果它是一個 dask 對象,則計算它並返回結果。默認情況下,還會遍曆 python 內置集合以查找 dask 對象(有關更多信息,請參閱traverse 關鍵字)。非 dask 參數不變地傳遞。

traverse布爾型,可選

默認情況下,dask 會遍曆內置的 python 集合,尋找傳遞給 compute 的 dask 對象。對於大型集合,這可能很昂貴。如果沒有任何參數包含任何 dask 對象,請設置 traverse=False 以避免執行此遍曆。

scheduler字符串,可選

要使用哪個調度程序,例如“threads”, “synchronous” or “processes”。如果沒有提供,默認是先檢查全局設置,然後回退到集合默認值。

optimize_graph布爾型,可選

如果為 True [默認],則在計算之前應用每個集合的優化。否則,圖表將按原樣運行。這對於調試很有用。

getNone

應該留給None get= 關鍵字已被刪除。

kwargs

轉發到調度程序函數的額外關鍵字。

例子

>>> import dask as d
>>> import dask.array as da
>>> a = da.arange(10, chunks=2).sum()
>>> b = da.arange(10, chunks=2).mean()
>>> d.compute(a, b)
(45, 4.5)

默認情況下,還將計算 python 集合中的 dask 對象:

>>> d.compute({'a': a, 'b': b, 'c': 1})
({'a': 45, 'b': 4.5, 'c': 1},)

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.compute。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。