文章详情页

python - beautifulSoup4 .select(’.bnrName’) 取不到到 text 文字

浏览：194日期：2022-07-25 15:24:15

问题描述

背景： Python3 下使用 bs4 的 select 去获取 ZOZO首页上方的 coupon 信息中店铺名字。（国内ip貌似看不到优惠券信息，需要翻一下才能看到，最好是岛国ip）

问题：发现自己找不到他的店铺名字在写在什么地方，不知道怎么取，前端 js 不懂，请教诸位解答。谢谢。

自己的代码如下：

import requests, bs4shopName = ’BEAUTY&YOUTH’url = ’http://zozo.jp/’def getZozoCoupon(): res = requests.get(url, headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.110 Safari/537.36'}) res.raise_for_status() soup = bs4.BeautifulSoup(res.text, ’html.parser’) elems = soup.select(’.bnrName’) return elems[0].text.strip()

如下截图中是想要获取的文字， python - beautifulSoup4 .select(’.bnrName’) 取不到到 text 文字

发现查看源码中却没有文字。

说好的文字呢。。。

请教他的文字是在哪实现的啊，要怎么用bs4 select才出来，谢谢。

问题解答

回答1：

有可能用ajax从服务器获取之后操作dom动态添加的吧，在浏览器里执行了js就文字也被添加进来。而你用爬虫爬的时候没有执行有关js所以也没有添加文字。

要是真的这样的话，你可以在浏览器的f12那里查看network，把获取文字的那个http请求的url找出来，直接请求这个url获取你需要的信息。

回答2：

我在浏览器中打开http://zozo.jp/查看源代码并没有找到你所要找的bnrName python - beautifulSoup4 .select(’.bnrName’) 取不到到 text 文字

回答3：

你在浏览器上右键“查看网页源码”看看能不能找得你那段文字，如果找不到，那网页应该是用js或者ajax动态加载的，想要爬取这种动态页面，两种方法，要么是自己手动模拟请求，要么就用selenium去抓吧

回答4：

确实是js生成的，已经采用headless浏览器模拟抓取了，谢谢大家！

Python 编程

上一条：python - 求解IP分割问题下一条：Python链接加中午，输出中文不在链接里

相关文章：

1. dockerfile - 为什么docker容器启动不了？2. html5 - node静态资源服务器设置了Cache-Control，但浏览器从来不走3043. debian - docker依赖的aufs-tools源码哪里可以找到啊？4. 对html实现监测发现不对5. docker - 各位电脑上有多少个容器啊？容器一多，自己都搞混了，咋办呢？6. angular.js - angular内容过长展开收起效果7. 为什么我ping不通我的docker容器呢？？？8. docker内创建jenkins访问另一个容器下的服务器问题9. angular.js使用$resource服务把数据存入mongodb的问题。10. javascript - js中向下取整

排行榜

					
					html5 - node静态资源服务器设置了Cache-Control，但浏览器从来不走304
为什么我ping不通我的docker容器呢？？？
debian - docker依赖的aufs-tools源码哪里可以找到啊？
dockerfile - 为什么docker容器启动不了？
angular.js - angular内容过长展开收起效果
docker - 各位电脑上有多少个容器啊？容器一多，自己都搞混了，咋办呢？
对html实现监测  发现不对
docker内创建jenkins访问另一个容器下的服务器问题
android - Apk 中找不到r类文件
angular.js使用$resource服务把数据存入mongodb的问题。
docker - 如何修改运行中容器的配置
				

热门标签