您的位置:首页技术文章
文章详情页

python - scrapy 如何组合2个不同页面的数据,一并存储

【字号: 日期:2022-06-29 10:02:12浏览:30作者:猪猪

问题描述

1 比如有博客列表页 a ,获取文章列表2 博客内容详情页 b , 获取文章正文3 如何依次获取到文章 + 内容 到数据库 ?4 当前问题主要是不知道如何组合2个不同页面的数据

问题解答

回答1:

可以用request.meta来存储额外的信息, 比如

def parse_x1(self, response): extra = {} ... req = scrapy.Request(url2) req.callback = self.parse_x2 ... req.meta[’extra’] = extra yield req def parse_x2(self, response): item = {} extra = response.meta[’extra’] item.update(extra) ...yield item

标签: Python 编程