python - Scrapy中xpath用到中文报错
问题描述
问题描述links = sel.xpath(’//i[contains(@title,'置顶')]/following-sibling::a/@href’).extract()
报错:ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters
问题解答
回答1:参见文章:解决Scrapy中xpath用到中文报错问题
解决方法方法一:将整个xpath语句转成Unicode
links = sel.xpath(u’//i[contains(@title,'置顶')]/following-sibling::a/@href’).extract()
方法二:xpath语句用已转成Unicode的title变量
title = u'置顶'links = sel.xpath(’//i[contains(@title,'%s')]/following-sibling::a/@href’ %(title)).extract()
方法三:直接用xpath中变量语法($符号加变量名)$title, 传参title即可
links = sel.xpath(’//i[contains(@title,$title)]/following-sibling::a/@href’,).extract()回答2:
整个字符串前加个u试试
相关文章:
1. java - web端百度网盘的一个操作为什么要分两次请求服务器, 有什么好处吗2. docker镜像push报错3. docker - 如何修改运行中容器的配置4. docker start -a dockername 老是卡住,什么情况?5. 正在使用electron和node.js做桌面应用,需要实时监听是否有网络连接,node或者electron是否可以做到6. docker安装后出现Cannot connect to the Docker daemon.7. node.js - express框架,设置浏览器从缓存中读取静态文件,只有js从缓存中读取了,css还有一些图片为何没有从缓存中读取?8. vim - docker中新的ubuntu12.04镜像,运行vi提示,找不到命名.9. java - 如何点击按钮,重新运行(我是初学者)?10. jquery - js向两边展开

网公网安备