文章详情页

PC端访问却变成移动端地址问题#python#scrapy

浏览：214日期：2022-06-27 08:35:16

问题描述

用scrapy 爬取喜马拉雅，爬取PC端地址，入口链接的response没问题，但后面response看到的是移动端地址。。。。

spider 代码如下：

class SpxmlySpider(scrapy.Spider): name = ’ximalaya’ allowed_domains = ['ximalaya.com'] # 保存每页链接 start_urls = [’http://www.ximalaya.com/dq/all/{}’.format(num) for num in range(2, 3)] #先改为第二页试试 def parse(self, response):# 取出专辑链接print(response)mainurls = response.xpath(’//p[@class='albumfaceOutter']/a/@href’).extract()# for url in mainurls:# yield Request(url = url, callback=self.parse_details)print(mainurls[0])yield Request(url = mainurls[0], dont_filter=True, callback = self.parse_details)# TODO 为什么PC端访问会变成移动地址问题！！！！！！！！！！！！！！！！！ def parse_details(self, response):item = XimalayaItem()print(response)......以下省略

控制台输出：

PC端访问却变成移动端地址问题#python#scrapy

已经写了一个 middlewares.RotateUserAgentMiddleware，是生效的，输出内容也可以看出来。

是不是触发什么反爬机制？

问题解答

回答1：

应该是你的headers没有设置user-agent的原因

回答2：

request headers 好好配置一下, 判断是不是移动端一般是靠user-agent啥都没有也能访问到数据，也说明目标网站没怎么在意防盗链

Python 编程

上一条：python - Django操作数据库遇到问题，无法查询更新后的数据下一条：python - scrapy抓取知网response的内容重复

相关文章：

1. debian - docker依赖的aufs-tools源码哪里可以找到啊？2. 为什么我ping不通我的docker容器呢？？？3. vim - docker中新的ubuntu12.04镜像,运行vi提示,找不到命名.4. docker网络端口映射，没有方便点的操作方法么？5. docker-compose 为何找不到配置文件？6. mac连接阿里云docker集群，已经卡了2天了，求问？7. docker安装后出现Cannot connect to the Docker daemon.8. golang - 用IDE看docker源码时的小问题9. docker images显示的镜像过多，狗眼被亮瞎了，怎么办？10. Android和JS的交互问题

排行榜

					
					docker安装后出现Cannot connect to the Docker daemon.
为什么我ping不通我的docker容器呢？？？
debian - docker依赖的aufs-tools源码哪里可以找到啊？
docker网络端口映射，没有方便点的操作方法么？
docker-compose 为何找不到配置文件？
mac连接阿里云docker集群，已经卡了2天了，求问？
vim - docker中新的ubuntu12.04镜像,运行vi提示,找不到命名.
golang - 用IDE看docker源码时的小问题
关于docker下的nginx压力测试
Docker for Mac 创建的dnsmasq容器连不上/不工作的问题
docker - 如何修改运行中容器的配置
				

热门标签