文章详情页

Python爬虫爬取博客实现可视化过程解析

【字号：大中小】日期：2022-07-19 13:36:30浏览：17作者：猪猪

源码：

from pyecharts import Barimport reimport requestsnum=0b=[]for i in range(1,11): link=’https://www.cnblogs.com/echoDetected/default.html?page=’+str(i) headers={’user-agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36’} r=requests.get(link,headers=headers) html=r.text post=re.findall(’<span class='post-view-count'>(.*?)</span>’,html)for i in post: i = i.replace('阅读(', '') i = i.replace(')','') b.append(i) num=num+1columns=[]for i in range(1,num+1):#设置行名 columns.append(’博客’+str(i))#设置数据#设置柱状图的主标题与副标题bar = Bar('柱状图', '每个博客阅读数量')#添加柱状图的数据及配置项，先行后列bar.add('阅读量', columns, b, mark_line=['average'], mark_point=['max', 'min'])#生成本地文件（默认为.html文件）bar.render()

爬虫不是重点，只是拿来爬阅读数量，pyecharts是重点

这次爬的是我自己的博客，一共10页，每页10片文章，正好写了100篇博客

pyecharts安装：

pip install wheelpip install pyecharts==0.1.9.4

直接pip install pyecharts会下载最新版无法调用

注意点：pyecharts调用，貌似无法实现多个py文件一起调用（意思是编写时不能在多个文件里出现import语句）

步骤解释：

1.爬虫爬取阅读数

2.去除非法字符装入新的数组

3.设置横轴数据，生成柱状图

4.在当前目录下生成render.html，打开查看柱状图

结果：

Python爬虫爬取博客实现可视化过程解析

柱状图是动态的，不是静态的

Python爬虫爬取博客实现可视化过程解析

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持好吧啦网。

Python 编程

上一条：Python根据指定文件生成XML的方法下一条：Python sublime安装及配置过程详解

相关文章：

1. asp画中画广告插入在每篇文章中的实现方法2. PHP字符串前后字符或空格删除方法介绍3. JavaScript实现组件化和模块化方法详解4. 将properties文件的配置设置为整个Web应用的全局变量实现方法5. 在Asp.net core项目中使用WebSocket6. ASP.NET MVC使用异步Action的方法7. PHP的FTP学习（一）8. XML入门精解之结构与语法9. 利用FastReport传递图片参数在报表上展示签名信息的实现方法10. Javaweb工程运行报错HTTP Status 404解决办法

排行榜

					
					将properties文件的配置设置为整个Web应用的全局变量实现方法
PHP的FTP学习（一）
PHP字符串前后字符或空格删除方法介绍
XML入门精解之结构与语法
ASP.NET MVC使用异步Action的方法
asp画中画广告插入在每篇文章中的实现方法
在Asp.net core项目中使用WebSocket
JavaScript实现组件化和模块化方法详解
SpringMVC+Jquery实现Ajax功能
matplotlib如何设置坐标轴刻度的个数及标签的方法总结
python imutils包基本概念及使用
				

热门标签