文章详情页
python - 关于beautifulsoup获取文档内容
浏览:57日期:2022-06-28 08:25:17
问题描述
获取到的资料保存到了本地端打算用beautifulsoup解析资料,如图:
<p><strong>释名</strong><br/>人龙。</p><p><strong>气味</strong><br/>大寒。</p><p><strong>主治</strong><br/>多年风眼。用蛔虫五条,晒干,研为末,加腻粉一钱、石胆半钱,共研为末点眼。每日二、三次。<br/>一切冷瘘。和人吐蛔虫烧灰涂搽。涂前以甘草汤洗净患处。<br/>小儿赤眼(胎赤眼或风赤眼)。用小儿吐出的蛔虫二长,装磁盒中,纸封好,埋湿地内。过五天取出,收存汁水。每日以箸蘸汁点眼。此方名“玉箸煎”。</p>
我的代码如下:
for i in soup.find_all(’strong’): print(i.string)
但是输出是:释名气味主治
而这几个所跟着的内容却没有输出,我知道是我的代码问题,但是又不知道怎么解决。另外,我想问用beautifulsoup是不是不能解析保存下来的文字档,我看网上的教程都是在源代码上摘取标签从而获得想要的内容。
问题解答
回答1:因为你查找的部分是strong标签(soup.find_all(’strong’)),所以没有加重标签的部分就不会被遍历到啊,其中只有释名 气味 主治是有strong标签的。
相关文章:
1. 关docker hub上有些镜像的tag被标记““This image has vulnerabilities””2. javascript - 关于Js中 this的一道题3. 网页爬虫 - Python:爬虫的中文编码问题?4. javascript - 修改表单多选项时和后台同事配合的问题。5. javascript - H5页面怎么查看console信息?6. mysql - 我的myeclipse一直连显示数据库连接失败,不知道为什么7. ubuntu 远程管理KVM设置问题8. css - 手机页面在安卓和苹果浏览器显示不同的小小问题9. javascript - vue生成一维码?求助!!!!!急10. browsersync检测的静态页面只能用index.html命名,用demo.html就不能实时同步,检测动态页面的时候,比如wamp环境下,用browsersync能打开页面,但不能实现同步
排行榜
