python - Notepad2与PyCharm区别
问题描述
同样的代码在 Notepad 环境(测试过记事本)过不了,在 Pycharm 可以过( Python3.5 )代码:
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data = data.decode(’UTF-8’)
这条语句,两个环境都可以过
data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
在 Pycharm 显示爬出的网页,在 cmd 窗口显示
UnicodeEncodeError: ’gbk’ codec can’t encode character ’xbb’ in position 26830:illegal multibyte sequence
必须去除无效字符。
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
这样可以过,求解释
问题解答
回答1:你遇到的可能和我一样是python编码问题,或者使用的terminal的编码支持问题。看看下面的问题。
【python编码问题?】分享自@SegmentFault,传送门:/q/10...
相关文章:
1. angular.js - 百度支持_escaped_fragment_吗?2. vue.js - vue apache 代理设置3. 我在centos容器里安装docker,也就是在容器里安装容器,报错了?4. android - 分享到微信,如何快速转换成字节数组5. html - css布局问题,背景用用div画的三角形是否用absolute与z-index来定位与规定在下方是否是个好方案6. javascript - $(document).scrollTop()与某个div的$(’#js_productWrap’).offset().top7. android.text.Html.fromHtml()无法解析<ol><li> </li></ol>应该怎么解决8. node.js - Vue+Webpack在dev环境下没有问题build后出现莫名错误9. node.js - nodejs+express+vue10. javascript - vue2.0中使用vue2-dropzone的demo,vue2-dropzone的github网址是什么??百度不到。
