文章详情页
python - scrapy 再次请求的问题
浏览:183日期:2022-08-17 18:54:48
问题描述
如:item[’url’]=response.xpath(’a/@href’)分析出一个链接,然后想从这个链接里的网页再获取一些元素,放入item[’other’]。应该怎么写,谢谢。
问题解答
回答1:def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True,callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item
最后附上官方文档https://doc.scrapy.org/en/lat...中文翻译版http://scrapy-chs.readthedocs...
相关文章:
1. docker gitlab 如何git clone?2. dockerfile - [docker build image失败- npm install]3. android webview和远程页面交互?4. 用命令无法登陆mysql页面求解答5. java - List<List<model>>如何更快捷的取里面的model?6. java - com.android.internal.R.attr.dialogTheme 这个dialogTheme的内容再哪里查看?7. [python2]local variable referenced before assignment问题8. java - jdbcTemplate支持复杂对象的映射吗?9. java - 哪位大神做过考勤打卡定位功能?请大神指点10. java - log4j和slf4j 【配置有知道的么】
排行榜
![dockerfile - [docker build image失败- npm install]](http://www.haobala.com/attached/image/news/202311/1028105a80.png)
网公网安备