文章详情页

Python爬虫requests库多种用法实例

浏览：56日期：2022-07-24 10:21:09

requests安装和使用

下载安装：pip install requests

#requests模块import requests#发送请求 content:以二进制的形式获取网页的内容response=requests.get('http://www.baidu.com').content.decode()#response=requests.request('get','http://www.baidu.com').content.decode()print(response)

添加请求头和参数

import requestsurl='http://www.baidu.com/s?'headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}wd={'wd':'中国'}response=requests.get(url,params=wd,headers=headers)# 返回一个字符串形式的数据data=response.text# 返回一个二进制形式的数据data2=response.contentprint(data2.decode())

处理Post请求

处理get请求：get()方法

处理post请求：post()方法

import requestsimport re#构造请求头信息header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'}#谷歌浏览器#http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule 网页上的urlurl='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'key='靓仔'#发送到web服务器的表单数据formdata={'i':key,'from':'AUTO','to':'AUTO','smartresult':'dict','client':'fanyideskweb','salt':'15880563488791','sign':'cc2c40d740538fc5edc0380891faef27','ts':'1588053583943','bv':'f9c86b1fdf2f53c1fefaef343285247b','doctype':'json','version':'2.1','keyfrom':'fanyi.web','action':'FY_BY_REALTlME'}response=requests.post(url,headers=header,data=formdata)# 获取到的是json数据# 对应的是字典# print(response.json())pat=r’'tgt':'(.*?)'}]]’ #字符串中有'',再用’’括起来表示字符串# 获取到的是字符串result=re.findall(pat,response.text)print(result[0])

代理IP

import requests#设置ip地址#proxy={'http':'http://代理ip地址:端口号'}#可以设置多个proxy={'http':'http://222.82.130.23:8060','http':'http://101.248.64.68:80',}response=requests.get('http://www.baidu.com',proxies=proxy)print(response.content.decode())

获取响应的cookie

cookie：用户信息

import requestsresponse=requests.get('http://www.baidu.com')#1.获取返回的cooketjar对象cookiejar=response.cookies#2.将cookiejar转换成字典cookiedict=requests.utils.dict_from_cookiejar(cookiejar)print(cookiedict)

session实现登陆

相比直接使用cookie，创建session可以得到新的cookie信息，不会出现cookie失效的情况

#使用session实现登陆import requests#构造请求头信息header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'}#谷歌浏览器#创建session对象ses=requests.session()#构造登陆需要的参数data={'email':'325*****@qq.com','password':'123321a'}#通过传递用户名密码得到cookie信息ses.post('http://www.renren.com/PLogin.do',data=data,headers=header)#请求需要的页面,每次请求会带入cookie信息response=ses.get('http://www.renren.com/880151247/profile')print(response.text)

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持好吧啦网。

Python 编程

上一条：Python selenium 加载并保存QQ群成员,去除其群主、管理员信息的示例代码下一条：python中有函数重载吗

相关文章：

1. vue使用moment如何将时间戳转为标准日期时间格式2. Python数据相关系数矩阵和热力图轻松实现教程3. js select支持手动输入功能实现代码4. 《Java程序员修炼之道》作者Ben Evans：保守的设计思想是Java的最大优势5. java加载属性配置properties文件的方法6. CSS3中Transition属性详解以及示例分享7. bootstrap select2 动态从后台Ajax动态获取数据的代码8. php redis setnx分布式锁简单原理解析9. ASP常用日期格式化函数 FormatDate()10. 什么是Python变量作用域

排行榜

					
					Python数据相关系数矩阵和热力图轻松实现教程
如何在PHP中读写文件
vue-drag-chart 拖动/缩放图表组件的实例代码
PHP正则表达式函数preg_replace用法实例分析
php redis setnx分布式锁简单原理解析
一个 2 年 Android 开发者的 18 条忠告
Spring @Primary和@Qualifier注解原理解析
Vue实现仿iPhone悬浮球的示例代码
Spring Boot应用开发初探与实例讲解
JS数据类型分类及常用判断方法
关于docker部署的jenkins跑git上的程序的问题
				

热门标签