文章详情页

python - 如何爬取跳转网站的数据

浏览：171日期：2022-06-30 14:37:44

问题描述

目前在学习一些爬虫的知识，对于一些复杂的网站使用selenium进行爬取。碰到一个问题，我需要爬取的工单网站（不知道密码）需要先通过登录一个鉴权系统，然后鉴权系统页面点击其中的工单系统连接，就会自动免登录跳转到工单系统网站，这种系统的数据我该如何使用爬虫进行抓取？以下是鉴权系统selenium拿到关于工单系统的html

问题解答

回答1：

用firefox的扩展selenium ide录制一遍操作。然后导出为python文件。改改运行就可以了。

建议你去读读虫师写的书。

回答2：

例如使用requests库作为爬虫的话，先创建session()，A登录，B是跳转的页面即可。

T=requests.session()A=T.post(url=url,data=data)B=T.get(url=url)

创建的T就代表存储的cookie，会一直保留

Python 编程

上一条：python如何获得一个url地址对应的跳转后的最终网址下一条：python - Django如何在View中发送异步HTTP请求？

相关文章：

1. html - angular项目中如何让外链网页在本项目中展示？2. linux - 将java项目部署在vbox的centos系统上,无法实现外网访问到java项目3. spring-mvc - spring-session-redis HttpSessionListener失效4. node.js - nodejs+express+vue5. javascript - 在 model里定义的引用表模型时，model为undefined。6. wordpress - nginx 反代 Varnish 走 Https ，WP后台 ‘您没有足够的权限访问该页面。’7. javascript - input 是不是不能同时用：value和v-model8. mysql - 查询修改数据库优化问题吧9. Help！求帮助10. jquery - js向两边展开

排行榜

					
					node.js - nodejs+express+vue
html - angular项目中如何让外链网页在本项目中展示？
spring-mvc - spring-session-redis HttpSessionListener失效
node.js - 刚装上最新node，npm install报这个错误！求ndoe大神解答！！！
wordpress - nginx 反代 Varnish 走 Https ，WP后台 ‘您没有足够的权限访问该页面。’
mysql - 查询 修改数据库优化问题吧
javascript - input 是不是不能同时用：value和v-model
Help！求帮助
javascript - 在 model里定义的 引用表模型时，model为undefined。
做Redis集群的时候，可不可以将Master实例和Slave实例放在一个主机当中？
jquery - js向两边展开
				

热门标签