文章详情页
网页爬虫 - Python爬虫返回状态码与实际情况不符?
问题描述
import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open(’http://www.sxxrcs.com/was5/web/’)html = response.codeprint html
比如这个爬虫,输出状态码是200。
可是直接访问http://www.sxxrcs.com/was5/web/是404,抓包响应的也是404,请问这是为什么?
问题解答
回答1:用requests吧
import requestsr = requests.get(’http://www.sxxrcs.com/was5/web/’)print r.status_codeprint r.text回答2:
200正常啊,requests方便快捷。
相关文章:
1. angular.js - ionic该如何强制刷新页面2. angular.js - angularjs 使用ng-hide的问题。3. 最新版 Cmder 结合 Ubuntu bash on windows10 使用时每个汉字都重复出现4. node.js - 利用vue-cli 构建执行到npm run dev 报错,求解~5. Angular.js 无法设置Authorization头,该怎么解决?6. javascript - 关于正则表达式的一些问题7. java - 微信退款,公账号向个人转账SSL验证失败8. node.js - vue 子组件的菜单 如何与 父组件 通信?9. android - 解决DatePickerDialog样式不一致10. 页面样式问题
排行榜