网页爬虫 - 关于python3.x 编写爬虫异常问题请各位大神帮忙!
问题描述
这段代码一直出现异常,但只要把导入的库稍加更改在python2.x中运行是没有问题的,请问大神问题出在哪?出现的异常也总变,小弟初学爬虫,请赐教!
import urllib.errorimport urllib.requestimport urllib.parseurl = ’http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=https://www.baidu.com/link HTTP/1.1’data = {}data[’type’]= ’AUTO’data[’i’] = ’I am fine !’data[’doctype’] = ’json’data[’xmlVersion’] = ’1.8’data[’keyfrom’] = ’fanyi.web’data[’ue’] = ’UTF-8’data[’action’] = ’FY_BY_CLICKBUTTON’data[’typoResult’] = ’true’head = {}head[’User-Agent’]= ’Mozilla/5.0 (Windows NT 6.1; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0’ try: data = urllib.parse.urlencode(data).encode(’utf-8’) req = urllib.request.Request(url,data,head) response = urllib.request.urlopen(req) html = response.read().decode(’utf-8’) print(html)except urllib.error.HTTPError as e: print (’Error code : ’,e.code)except urllib.error.URLError as e: print (’The reason: ’,e.reason)
昨天是这样的:
今天运行就这样了:
问题解答
回答1:删掉url后面 HTTP/1.1,url后面加它干嘛。。
回答2:Python3不用解码和编码啦,还有些模块的用法不一样了,自己看一下Python3的文档吧
回答3:相关文章:
1. 微信chooseImage接口部分机型选择图片后莫名其妙的跳转其他页面2. python - 用urllib抓取网页上的下载链接,目标文件是xls形式,但发现抓下来的xls是空表,里面只有一句报错信息,求帮助。3. c++ - win764位环境下,我用GCC为什么指针占8个字节,而long是4个字节?4. javascript - 这个用h5做还是flash做好一些?5. html - 谁能推荐一个类似apple官网的模板,用来展示产品的?6. HTML5禁止img预览该怎么解决?7. css3 - 微信前端页面遇到的transition过渡动画的bug8. web前端是做什么的9. 找一个权威、实战的微信扫码授权登录网站的开发教程或者文章10. css - 百度Ueditor富文本编辑器初始化赋值font-size没有值?