文章详情页
如何提高python查询速度?
浏览:121日期:2022-06-29 18:39:57
问题描述
最近在爬股票的相关新闻,一开始设想的是,当有新的新闻动态发布,程序通过邮件发送最新内容到邮箱。
所以我想把新闻标题,内容存到数据库里,当内容更新时,把新的内容和数据库的标题列表对比,看是不是已存在的,如果已存在,那就不发送,如果没有,那发送到邮箱。
但数量大了以后,列表查询速度就会变慢,请问各位还有什么方法可以传授下吗?
问题解答
回答1:爬虫任务去重
抓过的链接存到一个set中,检查新链接是否在集合中即可。
回答2:去重有很多方法,比如楼上的set或者布隆过滤器都可以有效的使用内存,提升效率
相关文章:
1. python - 获取到的数据生成新的mysql表2. javascript - js 对中文进行MD5加密和python结果不一样。3. mysql里的大表用mycat做水平拆分,是不是要先手动分好,再配置mycat4. window下mysql中文乱码怎么解决??5. sass - gem install compass 使用淘宝 Ruby 安装失败,出现 4046. python - (初学者)代码运行不起来,求指导,谢谢!7. 为啥不用HBuilder?8. python - flask sqlalchemy signals 无法触发9. python的文件读写问题?10. 为什么python中实例检查推荐使用isinstance而不是type?
排行榜
