文章详情页
python - 用scrapy-splash爬取网站 为啥iframe下的内容没有被返回
浏览:178日期:2022-08-10 09:23:22
问题描述
用scrapy-splash爬取网站 为啥iframe下的内容没有被返回?
import scrapyfrom scrapy import Selectorclass Music163Spider(scrapy.Spider): name = 'music163' allowed_domains = ['music.163.com/#/discover/toplist'] start_urls = [’http://music.163.com/#/discover/toplist/’] def parse(self, response):print('parse:',response.text) def start_requests(self):for url in self.start_urls: yield scrapy.Request(url, self.parse, meta={’splash’: { ’endpoint’: ’render.html’, ’args’: {’wait’: 0.5, }} })
问题解答
回答1:你需要在parse中获取iframe的url再次请求内容。
相关文章:
1. ddos - apache日志很多其它网址,什么情况?2. boot2docker无法启动3. javascript - 调微信分享朋友接口,出现下面问题,求解答,4. javascript - 关于audio标签暂停的问题5. css - weui 用伪元素生成border,源码有点不理解6. java - list<Map<String, Object>> 排序7. webpack - vue-cli写的项目(本地跑没有问题),准备放到Nginx服务器上,有什么配置需要改的?还有怎么部署?8. 微信公众号发送模板消息返回错误410009. 这是什么情况???10. javascript - iview 打包之后 找不到自带的icon图片,而且路径重复,点解
排行榜
