文章详情页
python - 用scrapy-splash爬取网站 为啥iframe下的内容没有被返回
浏览:229日期:2022-08-10 09:23:22
问题描述
用scrapy-splash爬取网站 为啥iframe下的内容没有被返回?
import scrapyfrom scrapy import Selectorclass Music163Spider(scrapy.Spider): name = 'music163' allowed_domains = ['music.163.com/#/discover/toplist'] start_urls = [’http://music.163.com/#/discover/toplist/’] def parse(self, response):print('parse:',response.text) def start_requests(self):for url in self.start_urls: yield scrapy.Request(url, self.parse, meta={’splash’: { ’endpoint’: ’render.html’, ’args’: {’wait’: 0.5, }} })
问题解答
回答1:你需要在parse中获取iframe的url再次请求内容。
相关文章:
1. docker内创建jenkins访问另一个容器下的服务器问题2. javascript - QQ第三方登录的问题3. node.js - nodejs+express+vue4. node.js - express框架,设置浏览器从缓存中读取静态文件,只有js从缓存中读取了,css还有一些图片为何没有从缓存中读取?5. java - web端百度网盘的一个操作为什么要分两次请求服务器, 有什么好处吗6. Angular.js 无法设置Authorization头,该怎么解决?7. java - 如何点击按钮,重新运行(我是初学者)?8. javascript - 请指条明路,angular的$event,在select中却是undefined?9. java - Spring boot 读取 放在 jar 包外的,log4j 配置文件,系统有创建日志文件,不写入日志信息。10. css3 - 这个效果用 CSS 可以实现吗?border-image
排行榜

网公网安备