用法:
persist(collections, optimize_graph=True, workers=None, allow_other_workers=None, resources=None, retries=None, priority=0, fifo_timeout='60s', actors=None, **kwargs)
在集群上持久化 dask 集合
在后台开始计算集群上的集合。提供一个新的 dask 集合,该集合在语义上与前一个集合相同,但现在基于当前正在执行的期货。
- collections:序列或单个 dask 对象
dask.array 或 dataframe 或 dask.value 对象等集合
- optimize_graph:bool
是否优化底层图
- workers:字符串或字符串的可迭代
一组可以对其执行计算的工作主机名。留空以默认所有工作人员(常见情况)
- allow_other_workers:布尔型(默认为 False)
与
workers
一起使用。指示是否可以对不在workers
集中的工作人员执行计算。- retries:整数(默认为 0)
计算结果失败时允许的自动重试次数
- priority:数字
任务的可选优先级。零是默认值。更高的优先级优先
- fifo_timeout:timedelta str(默认为'60s')
考虑相同优先级的调用之间允许的时间量
- resources:字典(默认为 {})
定义此映射任务的每个实例在worker上所需的
resources
;例如{'GPU': 2}
。有关定义资源的详细信息,请参阅工作人员资源。- actors:布尔或字典(默认无)
这些任务是否应该作为有状态的参与者存在于工人身上。在全局 (True/False) 或 per-task (
{'x': True, 'y': False}
) 基础上指定。有关更多详细信息,请参阅演员。- **kwargs:
传递给图形的选项优化调用
- 集合列表或单个集合,具体取决于输入类型。
参数:
返回:
例子:
>>> xx = client.persist(x) >>> xx, yy = client.persist([x, y])
相关用法
- Python distributed.Client.publish_dataset用法及代码示例
- Python distributed.Client.profile用法及代码示例
- Python distributed.Client.processing用法及代码示例
- Python distributed.Client.gather用法及代码示例
- Python distributed.Client.ncores用法及代码示例
- Python distributed.Client.retire_workers用法及代码示例
- Python distributed.Client.unregister_worker_plugin用法及代码示例
- Python distributed.Client.set_metadata用法及代码示例
- Python distributed.Client.scheduler_info用法及代码示例
- Python distributed.Client.submit用法及代码示例
- Python distributed.Client.compute用法及代码示例
- Python distributed.Client.nthreads用法及代码示例
- Python distributed.Client.unpublish_dataset用法及代码示例
- Python distributed.Client.start_ipython_scheduler用法及代码示例
- Python distributed.Client.get用法及代码示例
- Python distributed.Client.who_has用法及代码示例
- Python distributed.Client.get_versions用法及代码示例
- Python distributed.Client.run用法及代码示例
- Python distributed.Client.register_worker_plugin用法及代码示例
- Python distributed.Client.map用法及代码示例
注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 distributed.Client.persist。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。