文章详情页
python - scrapy 再次请求的问题
问题描述
如:item[’url’]=response.xpath(’a/@href’)分析出一个链接,然后想从这个链接里的网页再获取一些元素,放入item[’other’]。应该怎么写,谢谢。
问题解答
回答1:def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True,callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item
最后附上官方文档https://doc.scrapy.org/en/lat...中文翻译版http://scrapy-chs.readthedocs...
相关文章:
1. javascript - 引入 simditor,但是显示标签,这个怎么解决。2. android - 目前有哪些用Vue.js开发移动App的方案?3. docker api 开发的端口怎么获取?4. centos6.5 安装kvm5. java - android studio的安装路径问题6. background属性顺序?7. python - scrapy获取网页指定内容,后翻到下一页继续,固定循环次数。。问题8. Android PopupWindow 问题。9. calss调用了 也设置了颜色,可是网站不显示。请问大佬是什么情况啊10. apache - 装上IIS后WAMP就不能用了
排行榜