文章详情页
python - pyspider 定时爬取问题
浏览:49日期:2022-07-14 10:37:31
问题描述
在写爬虫的时候,发现 在代码中设置了 every 之后,21号爬取了一次之后,今天看 result 没有更新,那个 lastcrawltime 依旧是 21号的。请问是不是我的参数设置的不正确?
问题解答
回答1:你贴的这个 task 的图,是什么任务的?
贴的是 detail_page 的任务的
题主给 index_page 设置了小于 cronjob 间隔的时间。然而没有给 detail_page 设置。这样 detail_page 是不会被重新调度的
project 队列状态,最近活动任务是怎样的?
回答2:有可能是 every 和 age 不匹配。如果 age 没问题的话,说实话这属于疑难杂症了,我也经常遇到,我都是去 taskdb 把相应的表清空,然后重启 pyspider 重新运行项目
相关文章:
1. 微信小程序如何加载h5页面2. MYSQL代码执行错误:FUNCTION any_value does not exist3. node.js - nodejs开发中常用的连接mysql的库4. javascript - 在js for in 循环中,使用数组的push方法获取对象的属性,结果却未改变数组5. javascript - antDesign的table column最后一次加载的时候this是undefined 怎么回事6. javascript - 关于json中获取多个key-value对中多层嵌套key的name7. mysql - oracle物化视图和临时表的区别是什么?8. javascript - 如何通过参数获取Object的子节点?9. sort - javascript 手动指定对象阵列的顺序10. vue打包和PHP后台怎样同域名部署配置
排行榜