文章详情页
python - celery工作流的问题
问题描述
celery中,我做这样的处理:一个url经过a, b, c三个的函数,分别获得返回值,其中任意函数结果均与任意其他函数结果不相关,然后汇总起来,交给之后的流程.这样,我自然想到并行运行三个函数来加快处理速度.然而由于一开始的设计问题, a函数式被设计成了一次可以处理多个url的形式,而一个一个的处理会非常慢.
@celery.taskdef a(url_list): ’...do something...’ for url in url_list:b.delay(url)
我尝试这样控制,然而任务似乎并不能嵌套.那么,如何设计可以比较好的满足我这种比较奇怪的流程和要求呢?
问题解答
回答1:应该把a;b;c拆开,写成3个task, 同时数据库里要保存一个状态值,用来表示3个任务的执行状态,一个任务执行完成后,就修改状态值,并检查其他2个任务是否完成,如果都完成了,就汇总任务结果,再处理。
回答2:@xiaoboost 手工维护状态可行,但有点费事。
Celery 是可以设计执行流程的,参考文档:Designing Work-flows题主的需求可以用 chords 搞定,在 celery task 里返回值就行。
BTW: 注意一下 Celery 配置中与返回值相关的几个选项,比如这个 task_ignore_result
相关文章:
1. node.js - nvm怎么更新node的最新版本呀?2. html5 - 目前 公司App 嵌入H5页面 做个 手机支付功能 没有做过 所以 请求各位有经验的 给个思路3. PHP单例模式4. angular.js使用$resource服务把数据存入mongodb的问题。5. Angular.js 无法设置Authorization头,该怎么解决?6. angular.js - angular内容过长展开收起效果7. dockerfile - [docker build image失败- npm install]8. docker不显示端口映射呢?9. Docker for Mac 创建的dnsmasq容器连不上/不工作的问题10. html5 - Vue绑定动态变量不可用
排行榜