文章详情页
python - scrapy 再次请求的问题
浏览:155日期:2022-08-17 18:54:48
问题描述
如:item[’url’]=response.xpath(’a/@href’)分析出一个链接,然后想从这个链接里的网页再获取一些元素,放入item[’other’]。应该怎么写,谢谢。
问题解答
回答1:def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True,callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item
最后附上官方文档https://doc.scrapy.org/en/lat...中文翻译版http://scrapy-chs.readthedocs...
相关文章:
1. boot2docker无法启动2. webpack - vue-cli写的项目(本地跑没有问题),准备放到Nginx服务器上,有什么配置需要改的?还有怎么部署?3. javascript - iview 打包之后 找不到自带的icon图片,而且路径重复,点解4. 问题Unknown column ’’ in ’where clause’5. javascript - 哪位大神指导下,如何实现今日头条头部导航列表,点那个类型,哪种类型就居中了?6. 微信公众号发送模板消息返回错误410007. 这是什么情况???8. redis存储微博点赞的人,如何存储?9. html - 为什么我给div设置display:inline然后设置height还是有效呢10. media-query - 请教为何CSS3媒体查询语法不能生效?
排行榜
