当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.dataframe.compute用法及代码示例


用法:

dask.dataframe.compute(*args, traverse=True, optimize_graph=True, scheduler=None, get=None, **kwargs)

一次计算几个 dask 集合。

参数

args对象

任意数量的对象。如果它是一个 dask 对象,则计算它并返回结果。默认情况下,还会遍历 python 内置集合以查找 dask 对象(有关更多信息,请参阅traverse 关键字)。非 dask 参数不变地传递。

traverse布尔型,可选

默认情况下,dask 会遍历内置的 python 集合,寻找传递给 compute 的 dask 对象。对于大型集合,这可能很昂贵。如果没有任何参数包含任何 dask 对象,请设置 traverse=False 以避免执行此遍历。

scheduler字符串,可选

要使用哪个调度程序,例如“threads”, “synchronous” or “processes”。如果没有提供,默认是先检查全局设置,然后回退到集合默认值。

optimize_graph布尔型,可选

如果为 True [默认],则在计算之前应用每个集合的优化。否则,图表将按原样运行。这对于调试很有用。

getNone

应该留给None get= 关键字已被删除。

kwargs

转发到调度程序函数的额外关键字。

例子

>>> import dask as d
>>> import dask.array as da
>>> a = da.arange(10, chunks=2).sum()
>>> b = da.arange(10, chunks=2).mean()
>>> d.compute(a, b)
(45, 4.5)

默认情况下,还将计算 python 集合中的 dask 对象:

>>> d.compute({'a': a, 'b': b, 'c': 1})
({'a': 45, 'b': 4.5, 'c': 1},)

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.compute。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。