文章详情页

html - Python2 BeautifulSoup 提取网页中的表格数据及连接

浏览：82日期：2022-08-17 14:19:41

问题描述

网址：http://quote.eastmoney.com/ce...要做的是提取网页中的表格数据（如：板块名称，及相应链接下的所有个股，依然是个表格）

暂时只写了这些代码：import urllib2from bs4 import BeautifulSoup

url=’http://quote.eastmoney.com/ce...’

req=urllib2.Request.(url)page=urllib2.urlopen(req)

soup=BeautifulSoup(page)table = soup.find('table')

但是table里面没有内容，也就是完全没找到，这是怎么回事啊。po是小白，希望大神们可以多多指教,谢谢！

问题解答

回答1：

因为是异步加载，数据在这里http://nufm.dfcfw.com/EM_Fina...

# coding:utf-8import requestsr = requests.get(’http://nufm.dfcfw.com/EM_Finance2014NumericApplication/JS.aspx?type=CT&cmd=C._BKGN&sty=FPGBKI&st=c&sr=-1&p=1&ps=5000&token=7bc05d0d4c3c22ef9fca8c2a912d779c&v=0.12043042036331286’)data = [_.decode(’utf-8’).split(’,’) for _ in eval(r.text)]url = ’http://quote.eastmoney.com/center/list.html#28003{}_0_2’lst = [(url.format(_[1].replace(’BK0’, ’’)), _[2]) for _ in data]print lst

Python 编程

上一条：python - 抓取天猫详情页里面的月销量，反爬非常厉害下一条：python 字典比较

相关文章：

1. mysql优化 - mysql count(id)查询速度如何优化?2. python - django 里自定义的 login 方法，如何使用 login_required()3. javascript - git clone 下来的项目想在本地运行 npm run install 报错4. node.js - node_moduls太多了5. mysql主从 - 请教下mysql 主动-被动模式的双主配置和主从配置在应用上有什么区别？6. angular.js - 不适用其他构建工具，怎么搭建angular1项目7. 主从备份 - 跪求mysql 高可用主从方案8. android-studio - Android 动态壁纸LayoutParams问题9. python如何不改动文件的情况下修改文件的修改日期10. 在Java中System.out.println 只能在method中使用吗?

排行榜

					
					主从备份 - 跪求mysql 高可用主从方案
mysql优化 - mysql count(id)查询速度如何优化?
javascript - git clone 下来的项目 想在本地运行 npm run install 报错
angular.js - 不适用其他构建工具，怎么搭建angular1项目
python - django 里自定义的  login 方法，如何使用 login_required()
android-studio - Android 动态壁纸LayoutParams问题
node.js - node_moduls太多了
python如何不改动文件的情况下修改文件的 修改日期
mysql主从 - 请教下mysql 主动-被动模式的双主配置 和 主从配置在应用上有什么区别？
sql语句如何按or排序取出记录
css3 - [CSS] 动画效果 3D翻转bug
				

热门标签