文章详情页

Python爬取YY评级分数并保存数据实现过程解析

浏览：2日期：2022-07-23 16:44:35

前言

当需要进行大规模查询时（比如目前遇到的情形：查询某个省所有发债企业的YY评级分数），人工查询显然太过费时，那就写个爬虫吧。

由于该爬虫实在过于简单，就只简单概述下。

一、请求端

通过观察YY评级的网页信息，如下图（F12或右击进入检查，点击network—>XHR—>headers）。

红色框表明是个get请求（其实这种网页基本都是Ajax get，需要总结实际url的规律的）。

绿色框即为实际URL，通过分析该URL，其由两部分组成。前半部分为“https://web.ratingdog.cn/v1/search?”，后半部分为黄色框内内容用“&”符号连接后的结果。黄色框内的内容，只有企业名称为变量，且为已知变量，那URL即可据此确定了。

Python爬取YY评级分数并保存数据实现过程解析

另外需注意，YY评级需要登录才可查询数据，在构建头部信息进行访问时，一定要提前登录，并在头部信息中放入登录信息和登录状态。

二、响应端

通过观察网页的响应信息（F12或右击进入检查，点击network—>XHR—>response），如下图。响应信息及其简单，我们所需要的YY评级分数安详地躺在那里，简单到一个正则表达式就可以提取出该数据。正则如下：

'msg'.*?'IssuerName':'(.*?)','YYRating':'(.*?)/10','IntrinsicRating'.*?'

Python爬取YY评级分数并保存数据实现过程解析

三、代码

所需数据较少，代码相对简单，就不建立函数了，直接一路到底吧。如下：

Python爬取YY评级分数并保存数据实现过程解析

运行代码后，得到结果如下。安徽省的100多条数据，就到了本地了

Python爬取YY评级分数并保存数据实现过程解析

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持好吧啦网。

Python 编程

上一条：Python如何在main中调用函数内的函数方式下一条：基于Python绘制个人足迹地图

相关文章：

1. asp读取xml文件和记数2. jsp+servlet简单实现上传文件功能（保存目录改进）3. WML语言的基本情况4. 小技巧处理div内容溢出5. xpath简介_动力节点Java学院整理6. 利用CSS制作3D动画7. IE6/IE7/IE8/IE9中tbody的innerHTML不能赋值的完美解决方案8. xml中的空格之完全解说9. 匹配模式 - XSL教程 - 410. 阿里前端开发中的规范要求

排行榜

					
					docker容器调用yum报错的解决办法
利用CSS制作3D动画
asp读取xml文件和记数
jsp cookie+session实现简易自动登录
idea自定义快捷键的方法步骤
IE6/IE7/IE8/IE9中tbody的innerHTML不能赋值的完美解决方案
匹配模式 - XSL教程 - 4
解决ajax请求后台,有时收不到返回值的问题
不使用XMLHttpRequest对象实现Ajax效果的方法小结
xml中的空格之完全解说
AspNetCore&MassTransit Courier实现分布式事务的详细过程
				

热门标签