文章详情页

python - 要抓取的网页内容在括号里，正则怎么写？

浏览：104日期：2022-09-02 08:56:00

问题描述

<dt> <span class='gray6 '>名称：</span> <a href='http://xiandai007.com/esf/' target='_blank'>安现</a> ( <a href='https://www.haobala.com/ho-a021551/' target='_blank'> 中间 </a><a href='https://www.haobala.com/ho-a011551-b03497/' target='_blank'> 草原牧场 #这是我要抓取的内容我把它放到组(.*?)里面。 </a> ) [ <a href='https://www.haobala.com/wenda/acchor'>图文</a> ] </dt>

我就是想抓取第9行那里的中文内容，放到一个组里面。本来应该很简单，但是试了好多次就是抓不到，报错是没有内容。估计和第5行，和11行的括号有关。请问怎么写正则才能抓得到？我原来这样写

d = re.search(r’<a id='agatdesf_B02_10'.*?>s*(.*?)s*</a>’, s).group(1)

抓不到，谁帮我看下错在哪里？

问题解答

回答1：

python3

html=’’’ <dt> <span class='gray6 '>名称：</span> <a href='http://xiandai007.com/esf/' target='_blank'>安现</a> ( <a href='https://www.haobala.com/ho-a021551/' target='_blank'> 中间 </a><a href='https://www.haobala.com/ho-a011551-b03497/' target='_blank'> 草原牧场 #这是我要抓取的内容我把它放到组(.*?)里面。 </a> ) [ <a href='https://www.haobala.com/wenda/acchor'>图文</a> ] </dt>’’’import rep=re.compile(r’<as+?[^>]*?id='agatdesf_B02_10'[^>]*>([^<]*)</a>’)print(p.findall(html)[0].strip())##草原牧场 #这是我要抓取的内容我把它放到组(.*?)里面。回答2：

推荐一本书精通正则表达式看看就都会了！

Python 编程

上一条：关于python list 写进txt中的问题下一条：python - flask问题

排行榜

					
					【python小白】  问关于property的顺序问题
javascript - 切换掉当前页面后该页面的js动画会暂停？
sql语句 - 如何在mysql中批量添加用户？
java - 使用struct2的标签读取不到Action里面的字段
docker内创建jenkins访问另一个容器下的服务器问题
android - 哪位大神知道java后台的api接口的对象传到前端后输入日期报错，是什么情况？求大神指点
PHP类属性声明？
phpstady在win10上运行
vue.js - vue获取mongodb中的数据起初显示未定义，但还是可以渲染
angular.js - angular指令中的scope属性中用&获取父作用域函数的问题
javascript - 求解答，koa-bodyparser获取到的参数是空对象，为什么？？？？？
				

热门标签