文章详情页
python - 关于beautifulsoup获取文档内容
问题描述
获取到的资料保存到了本地端打算用beautifulsoup解析资料,如图:
<p><strong>释名</strong><br/>人龙。</p><p><strong>气味</strong><br/>大寒。</p><p><strong>主治</strong><br/>多年风眼。用蛔虫五条,晒干,研为末,加腻粉一钱、石胆半钱,共研为末点眼。每日二、三次。<br/>一切冷瘘。和人吐蛔虫烧灰涂搽。涂前以甘草汤洗净患处。<br/>小儿赤眼(胎赤眼或风赤眼)。用小儿吐出的蛔虫二长,装磁盒中,纸封好,埋湿地内。过五天取出,收存汁水。每日以箸蘸汁点眼。此方名“玉箸煎”。</p>
我的代码如下:
for i in soup.find_all(’strong’): print(i.string)
但是输出是:释名气味主治
而这几个所跟着的内容却没有输出,我知道是我的代码问题,但是又不知道怎么解决。另外,我想问用beautifulsoup是不是不能解析保存下来的文字档,我看网上的教程都是在源代码上摘取标签从而获得想要的内容。
问题解答
回答1:因为你查找的部分是strong标签(soup.find_all(’strong’)),所以没有加重标签的部分就不会被遍历到啊,其中只有释名 气味 主治是有strong标签的。
相关文章:
1. javascript - prismplayer播放器全屏问题2. html5 - 急求?被公司问住了3. python相关问题求解决,有偿4. javascript - vue2.0中router.repalce跟router.push有什么区别,二者的应用场景是会有怎样的区别?5. javascript - 在sublime中如何给.vue文件注释?6. HTML5怎么访问本地文件?7. javascript - 这种上传图片预览怎么做?8. javascript - input输入框触发change事件后,外部元素会被选中9. javascript - 把字符串日期转换成一般时间格式后,发现小于10的数字不会自动添加0在前面,如下10. javascript - js判断一个数组是否重复
排行榜