文章详情页
如何提高python查询速度?
浏览:98日期:2022-06-29 18:39:57
问题描述
最近在爬股票的相关新闻,一开始设想的是,当有新的新闻动态发布,程序通过邮件发送最新内容到邮箱。
所以我想把新闻标题,内容存到数据库里,当内容更新时,把新的内容和数据库的标题列表对比,看是不是已存在的,如果已存在,那就不发送,如果没有,那发送到邮箱。
但数量大了以后,列表查询速度就会变慢,请问各位还有什么方法可以传授下吗?
问题解答
回答1:爬虫任务去重
抓过的链接存到一个set中,检查新链接是否在集合中即可。
回答2:去重有很多方法,比如楼上的set或者布隆过滤器都可以有效的使用内存,提升效率
相关文章:
1. javascript - 修改表单多选项时和后台同事配合的问题。2. javascript - H5页面怎么查看console信息?3. angular.js - angularjs 怎么封装 upload 上传4. dockerfile - [docker build image失败- npm install]5. javascript - 关于Js中 this的一道题6. mysql - 索引过滤性不好是由什么原因引起的,应该怎么解决7. mysql - 我的myeclipse一直连显示数据库连接失败,不知道为什么8. javascript - vue生成一维码?求助!!!!!急9. android - Listview模仿朋友圈点赞的TextView没有刷新?10. 网页爬虫 - Python:爬虫的中文编码问题?
排行榜
