文章详情页

网页爬虫 - Python爬虫返回状态码与实际情况不符？

浏览：299日期：2022-09-03 18:57:11

问题描述

import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open(’http://www.sxxrcs.com/was5/web/’)html = response.codeprint html

比如这个爬虫，输出状态码是200。

可是直接访问http://www.sxxrcs.com/was5/web/是404，抓包响应的也是404，请问这是为什么？

网页爬虫 - Python爬虫返回状态码与实际情况不符？

问题解答

回答1：

用requests吧

import requestsr = requests.get(’http://www.sxxrcs.com/was5/web/’)print r.status_codeprint r.text回答2：

200正常啊，requests方便快捷。

Python 编程

上一条：python - 模拟滑动验证码，有源码，求解下一条：python爬虫时，抓取网页遇到的问题？

相关文章：

1. 为什么我ping不通我的docker容器呢？？？2. golang - 用IDE看docker源码时的小问题3. angular.js - angular内容过长展开收起效果4. docker - 如何修改运行中容器的配置5. docker镜像push报错6. javascript - 关于数组的循环遍历问题7. css3 - IE浏览器下，一个元素设置overflow:auto后，出现下拉滚动条，拖动滚动条图片会移动，但文字不移动8. 关于phpstudy设置主从数据库9. docker-compose 为何找不到配置文件？10. javascript - 正则匹配字符串特定语句后的数字

排行榜

					
					docker - 如何修改运行中容器的配置
为什么我ping不通我的docker容器呢？？？
docker镜像push报错
golang - 用IDE看docker源码时的小问题
angular.js - angular内容过长展开收起效果
关于phpstudy设置主从数据库
docker-compose 为何找不到配置文件？
javascript - 正则匹配字符串特定语句后的数字
css3 - IE浏览器下，一个元素设置overflow:auto后，出现下拉滚动条，拖动滚动条图片会移动，但文字不移动
javascript - 关于数组的循环遍历问题
在cmd下进入mysql数据库，可以输入中文，但是查看表信息，不显示中文，是怎么回事，怎新手，请老师
				

热门标签