文章详情页
python - 用scrapy-splash爬取网站 为啥iframe下的内容没有被返回
浏览:255日期:2022-08-10 09:23:22
问题描述
用scrapy-splash爬取网站 为啥iframe下的内容没有被返回?
import scrapyfrom scrapy import Selectorclass Music163Spider(scrapy.Spider): name = 'music163' allowed_domains = ['music.163.com/#/discover/toplist'] start_urls = [’http://music.163.com/#/discover/toplist/’] def parse(self, response):print('parse:',response.text) def start_requests(self):for url in self.start_urls: yield scrapy.Request(url, self.parse, meta={’splash’: { ’endpoint’: ’render.html’, ’args’: {’wait’: 0.5, }} })
问题解答
回答1:你需要在parse中获取iframe的url再次请求内容。
相关文章:
1. Python如何利用Selenium或者PhantomJS爬取动态网页内容2. 为什么我ping不通我的docker容器呢???3. Docker for Mac 创建的dnsmasq容器连不上/不工作的问题4. 如何解决docker宿主机无法访问容器中的服务?5. javascript - chart.js如何修改某个指定bar的颜色6. angular.js - angularjs的自定义过滤器如何给文字加颜色?7. 请教使用PDO连接MSSQL数据库插入是乱码问题?8. javascript - 关于iscroll的一段代码,希望有人解释9. android - webview 自定义加载进度条10. objective-c - 使用axios 通过vuex mutation修改数据 getter第一次获取失败 第二次成功
排行榜

网公网安备