文章详情页
python - scrapy 再次请求的问题
浏览:167日期:2022-08-17 18:54:48
问题描述
如:item[’url’]=response.xpath(’a/@href’)分析出一个链接,然后想从这个链接里的网页再获取一些元素,放入item[’other’]。应该怎么写,谢谢。
问题解答
回答1:def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True,callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item
最后附上官方文档https://doc.scrapy.org/en/lat...中文翻译版http://scrapy-chs.readthedocs...
相关文章:
1. mysql 字段索引的问题2. javascript - 在nodejs的程序里面怎么理解IO呢,如何用一段代码来说明IO3. 在windows下安装docker Toolbox 启动Docker Quickstart Terminal 失败!4. 能用Nginx服务小型购物网站的web吗?5. 静态资源文件引入无效6. web - nginx location 搜索算法问题!?7. javascript - htaccess rewrite 的问题8. javascript - hammer.js panend 怎么区分是panleft 结束还是panright结束的?9. java 测试多线程执行时遇到的疑问?10. python - type="datetime-local" 的 input 如何通过 django form.is_valid() 校验
排行榜

网公网安备