文章详情页
python - scrapy 再次请求的问题
浏览:120日期:2022-08-17 18:54:48
问题描述
如:item[’url’]=response.xpath(’a/@href’)分析出一个链接,然后想从这个链接里的网页再获取一些元素,放入item[’other’]。应该怎么写,谢谢。
问题解答
回答1:def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True,callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item
最后附上官方文档https://doc.scrapy.org/en/lat...中文翻译版http://scrapy-chs.readthedocs...
相关文章:
1. 前端 - html5 audio不能播放2. java固定键值转换,使用枚举实现字典?3. vim - win10无法打开markdown编辑器4. mysql - 千万数据 分页,当偏移量 原来越大时,怎么优化速度5. 如何解决tp6在zend中无代码提示6. javascript - 有没有类似高铁管家的时间选择插件7. 这是什么情况???8. python - flask学习,user_syy添加报role is invalid keyword for User.9. css - BEM 中块(Block)有木有什么标准 何时决定一个部分提取为块而不是其父级的元素呢(Element)?~10. javascript - 微信网页开发从菜单进入页面后,按返回键没有关闭浏览器而是刷新当前页面,求解决?
排行榜
