文章详情页

网页爬虫 - Python requests.get 爬虫设置代理 IP地址未改变

浏览：206日期：2022-06-29 13:02:16

问题描述

工作需要爬取亚马逊上面的信息，但是亚马逊反爬虫太厉害，同一个IP地址会被封。Python版本：3.6， IDE：Pycharm 2017.1在网上查了很多资料，requests库的手册也读过，但是都是同一个方法，代码如下：

import requests’’’代理IP地址（高匿）’’’proxy = {’HTTPS’: ’117.85.105.170:808’}’’’head 信息’’’head = {’User-Agent’: ’Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36’, ’Connection’: ’keep-alive’}’’’http://icanhazip.com会返回当前的IP地址’’’p = requests.get(’http://icanhazip.com’, headers=head, proxies=proxy)print(p.text)

根据我看过的许多教程的理论，如果代理设置成功，最后显示的IP应该是代理的IP地址，但是最终还是我真实的IP地址，这样一来不就等于没有设置代理么？

问题解答

回答1：

proxies在你访问http时用http的设置，访问https时用https的设置所以你的proxy需要同时包含http及https的配置，这样才能生效

proxy = { ’http’: ’http://117.85.105.170:808’, ’https’: ’https://117.85.105.170:808’}

Python 编程

上一条：matplotlib - python函数的问题下一条：python 多进程或者多线程下如何高效的同步数据?

相关文章：

1. javascript - grunt server启动报错2. react router install 之后报错3. Vue项目打包后发布到github pages上，如何访问？4. mysql - 给千万数据的表增加索引，不影响使用，怎么处理？5. php无法输出6. dump(Db::query(’SELECT * FROM `user`’));的时候提醒错误。7. Mac怎么安装呢？8. 怎么自己编辑php框架9. MySQL中无法修改字段名的疑问10. slow-start - [ERROR] Failed to write to mysql.slow_log

排行榜

					
					Vue项目打包后发布到github pages上，如何访问？
javascript - grunt server启动报错
react router install 之后报错
javascript - 编程，算法的问题
win下面的cmder中的vim . 中文乱码. 试了百度上的各种解决方式.. 还是没弄好
CSS3可否做出这个效果？
css3 - rem布局下，用户浏览器的最小字号是12px怎么办？
服务器端 - 采用nginx做web服务器，C++开发应用程序 出现拒绝连接请求？
android - 安卓微信刷卡支付的DEMO
javascript - Express 和 request 如何代理远程图片？
css - transform-origin 旋转参考点
				

热门标签

网页爬虫 - Python requests.get 爬虫 设置代理 IP地址未改变

网页爬虫 - Python requests.get 爬虫设置代理 IP地址未改变