文章详情页

python爬虫 - Python:网页爬取Ajax地址，结果与浏览器显示的不一致？

浏览：100日期：2022-08-05 13:18:28

问题描述

1.我用在火狐上获取的Ajax地址来爬取统计局的信息： python爬虫 - Python:网页爬取Ajax地址，结果与浏览器显示的不一致？

获取的地址如下;

http://data.stats.gov.cn/easy...{'wdcode':'zb','valuecode':'A0201'}]&dfwds=[{'wdcode':'sj','valuecode':'199807'}]

我的理解是地址中包含了两个参数：'A0201'和'199807'可以通过改变着两个参数来获取不同表中不同时间的信息我在浏览器中直接输入地址参数为'199807'时显示结果为： python爬虫 - Python:网页爬取Ajax地址，结果与浏览器显示的不一致？参数为'199907'时显示结果为：证明应该是行得通的

但是当我用这个地址去爬虫时爬下来的结果却不是浏览器上看到的这些数据，应该是爬取到了别的表里的数据，但是我的参数不是已经设置好了吗？在浏览器也证明参数是有效的，但是为什么就是爬不到这些数据？是不是网页缓存方面出现了问题？应该如何解决呢？劳烦大神指教

问题解答

回答1：

server端可以验证你的cookie从而将你拒之门外，或者返回其他错误数据给你也是可以的，你可以从浏览器复制出来里伪造cookie，放在请求头里面。

Python 编程

上一条：python - SqlAlchemy中，一个query如何多次执行filter添加or条件？下一条：tornado - python使用yield是否能保证协程的顺序性？

排行榜

					
					主从备份 - 跪求mysql 高可用主从方案
mysql优化 - mysql count(id)查询速度如何优化?
javascript - git clone 下来的项目 想在本地运行 npm run install 报错
angular.js - 不适用其他构建工具，怎么搭建angular1项目
python - django 里自定义的  login 方法，如何使用 login_required()
android-studio - Android 动态壁纸LayoutParams问题
python如何不改动文件的情况下修改文件的 修改日期
mysql主从 - 请教下mysql 主动-被动模式的双主配置 和 主从配置在应用上有什么区别？
sql语句如何按or排序取出记录
angular.js - angular ui bootstrap 中文显示问题
angular.js - angularjs 用ng-reapt渲染的dom  怎么获取上面的属性
				

热门标签