文章详情页

网页爬虫 - python爬虫，需要爬取的数据没在网页源代码中，怎么处理？

浏览：76日期：2022-06-27 11:23:18

问题描述

我想抓取直播吧赛事的比分：直播吧链接，可是我用Scrapy只能抓取到日期，主客队等。我的问题是：比分是不是通过Script加载出来的？是不是在这个脚本中bf4.js中？这种Request Method:GET的情况如何准确获取出比分如下图？通过开发者工具查看出的网页源代码如下：<li label='足球,中甲,武汉卓尔' data-time='2017-06-24 15:00'>15:00 <b>中甲第15轮</b> 云南丽江 <img src='https://duihui.qiumibao.com/zuqiu/yunnanlijiang.png' > <span> - </span> <img src='https://duihui.qiumibao.com/zuqiu/wuhanzhuoer.png' > 武汉卓尔 <a href='https://www.haobala.com/zhibo/zuqiu/2017/0624yunnanlijiangvswuhanzhuoer.htm' target='_blank'>武汉文体广州竞赛 PPTV</a> <a href='http://wenzi.zhibo8.cc/zhibo/zuqiu/2017/0624yunnanlijiangvswuhanzhuoer.htm' target='_blank'>文字</a> <a href='https://www.zhibo8.cc/shouji.htm' target='_blank'>手机看直播</a> <a href='http://www.188bifen.com/' target='_blank'>比分</a> <a href='http://ogzq2.wanjiashe.com/game.php?sid=51&zhibo' target='_blank'>欧冠足球新服</a> </li>

即<span> - </span>中比分没显示，如何才能抓取渲染完成出来的比分网页呢？网页爬虫 - python爬虫，需要爬取的数据没在网页源代码中，怎么处理？

问题解答

回答1：

数据在https://bifen4pc.qiumibao.com/json/list.htm?74520

网页爬虫 - python爬虫，需要爬取的数据没在网页源代码中，怎么处理？

回答2：

那就使用Selenium 来获取吧，

链接描述

Python 编程

上一条：python - 关于爬虫爬取图片的问题？下一条：python - 如何将文本文件的CR换行符换成LF换行符？

相关文章：

1. 网页爬虫 - Python爬虫返回状态码与实际情况不符？2. 网页爬虫 - python爬虫用BeautifulSoup爬取<s>元素并写入字典，但某些div下没有这一元素，导致自动写入下一条，如何解决？3. 网页爬虫 - Python爬虫运行内存占用过高导致电脑停止响应4. 网页爬虫 - python爬虫爬图，报错<urlopen error no hsot given>.5. 网页爬虫 - Python爬虫如何正确判断页面是否可以爬取？6. 网页爬虫 - python爬虫翻页问题，请问各位大神我这段代码怎样翻页，还有价格要登陆后才能看到，应该怎么解决7. 网页爬虫 - Python爬虫入门知识

排行榜

					
					javascript - angular左右滑动如何切换路由状态，？？？？
javascript - 想要用Ajax 即时返回XML 中的数据，前后端怎么选择？
javascript - 可以DIY的页面是如何实现的？
android - gradle经常无限等待，所有的办法都用上了
javascript - avalon使用:duplex设置select默认option的bug
javascript - 两个js文件相互require
mysql - 要取出数据库中按某字段排序后的前10，20，30条数据要怎么做？
javascript - react-native在chrome调试工具中出现警告，并且不能使用react dev-tools
javascript - ajax请求不返回，关闭页面时才返回。。。
angular.js - angular2 有什么cool的loading组件么？
showpassword里的this 是什么意思？代表哪个元素
				

热门标签