文章详情页

Python爬虫基础之requestes模块

浏览：226日期：2022-06-21 10:14:08

一、爬虫的流程

开始学习爬虫，我们必须了解爬虫的流程框架。在我看来爬虫的流程大概就是三步，即不论我们爬取的是什么数据，总是可以把爬虫的流程归纳总结为这三步：

1.指定 url,可以简单的理解为指定要爬取的网址

2.发送请求。requests 模块的请求一般为 get 和 post

3.将爬取的数据存储

二、requests模块的导入

因为 requests 模块属于外部库，所以需要我们自己导入库

导入的步骤：

1.右键Windows图标

2.点击“运行”

3.输入“cmd”打开命令面板

4.输入“pip install requests”,等待下载完成

如图：

Python爬虫基础之requestes模块

如果还是下载失败，我的建议是百度一下，你就知道（我也是边学边写，是在是水平有限）

欧克，既然导入成功后我们就简单的来爬取一下搜狗的首页吧！

三、完整代码

import requestsif __name__ == '__main__': # 指定url url = 'https://www.sougou.com/' # 发起请求 # get方法会返回一个响应数据 response = requests.get(url) # 获取响应数据 page_txt = response.text # text返回一个字符串的响应数据 # print(page_txt) # 存储 with open('./sougou.html', 'w', encoding = 'utf-8') as fp:fp.write(page_txt) print('爬取数据结束！！！')

我们打开保存的文件，如图

Python爬虫基础之requestes模块

欧克，这就是最基本的爬取，如果学会了，那就试一试爬取 B站的首页吧。

到此这篇关于Python爬虫基础之requestes模块的文章就介绍到这了,更多相关Python requestes模块内容请搜索好吧啦网以前的文章或继续浏览下面的相关文章希望大家以后多多支持好吧啦网！

Python 编程

上一条：python爬虫之bs4数据解析下一条：python实现布尔型盲注的示例代码

相关文章：

1. idea导入maven项目的方法2. PHP中strval()函数实例用法3. 利用VS2019创建Web项目并发送到IIS及IIS与ASP.NET配置教程4. PHP组合模式Composite Pattern优点与实现过程5. docker /var/lib/docker/aufs/mnt 目录清理方法6. IntelliJ IDEA导出项目的方法7. springBoot下实现java自动创建数据库表8. Spring MVC数据绑定概述及原理详解9. Vue封装一个TodoList的案例与浏览器本地缓存的应用实现10. Java四种权限修饰符知识点详解

排行榜

					
					IntelliJ IDEA导出项目的方法
利用VS2019创建Web项目并发送到IIS及IIS与ASP.NET配置教程
idea导入maven项目的方法
docker /var/lib/docker/aufs/mnt 目录清理方法
PHP组合模式Composite Pattern优点与实现过程
PHP中strval()函数实例用法
Spring MVC数据绑定概述及原理详解
IntelliJ IDEA安装插件的方法步骤
使用 kind 和 Docker 启动本地的 Kubernetes环境
使用Docker的NFS-Ganesha镜像搭建nfs服务器的详细过程
IntelliJ IDEA设置编码格式的方法
				

热门标签