您的位置:首页技术文章
文章详情页

python - 把<dl></dl>标签包含进去如何拿到我想要的内容

【字号: 日期:2022-07-21 08:07:19浏览:46作者:猪猪

问题描述

1.我把<dl>标签加进去拿到的是空内容,我该怎么写匹配规则,不加<dl>标签倒是可以拿到想要的内容2.问题代码

pattern = re.compile(r’<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’)

3.不把<dl>标签加进去可以拿到想要的内容python - 把<dl></dl>标签包含进去如何拿到我想要的内容

4.附上网页源代码

<dl><dt>《明末工程师》正文</dt><dd><a href='https://www.haobala.com/book/1440/xx'>第一章 穿越后的窘境</a></dd></dl>

问题解答

回答1:

# 你可能需要加个模式# re.S 使 . 匹配包括换行在内的所有字符pattern = re.compile(r’<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’, re.S)print re.findall(pattern, a)回答2:

// /需要转义下<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>

标签: Python 编程
相关文章: