文章详情页
python - 把<dl></dl>标签包含进去如何拿到我想要的内容
浏览:74日期:2022-07-21 08:07:19
问题描述
1.我把<dl>标签加进去拿到的是空内容,我该怎么写匹配规则,不加<dl>标签倒是可以拿到想要的内容2.问题代码
pattern = re.compile(r’<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’)
3.不把<dl>标签加进去可以拿到想要的内容
4.附上网页源代码
<dl><dt>《明末工程师》正文</dt><dd><a href='https://www.haobala.com/book/1440/xx'>第一章 穿越后的窘境</a></dd></dl>
问题解答
回答1:# 你可能需要加个模式# re.S 使 . 匹配包括换行在内的所有字符pattern = re.compile(r’<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’, re.S)print re.findall(pattern, a)回答2:
// /需要转义下<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>
相关文章:
1. java - 创建maven项目失败了 求解决方法2. java-se - 正在学习Java SE,为什么感觉学习Java就是在学习一些API。3. 一个走错路的23岁傻小子的提问4. python - 如何使用pykafka consumer进行数据处理并保存?5. javascript - SuperSlide.js火狐不兼容怎么回事呢6. node.js - 函数getByName()中如何使得co执行完后才return7. 运行python程序时出现“应用程序发生异常”的内存错误?8. 主从备份 - 跪求mysql 高可用主从方案9. javascript - git clone 下来的项目 想在本地运行 npm run install 报错10. python - django 里自定义的 login 方法,如何使用 login_required()
排行榜
