您的位置:首页技术文章
文章详情页

a标签 url 正则怎么写(python 或者js)

【字号: 日期:2022-07-17 17:06:50浏览:66作者:猪猪

问题描述

<a target='blank'href='http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&amp;page=1&amp;viewtype=basic&amp;category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp;page=1&amp;viewtype=basic&amp;category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp;page=1&amp;viewtype=basic&amp;category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp'></a><a target='blank'href='http://a.b.c.d/abc'></a><a target='blank'href='http://a.b.c.d/123'></a>

我要取 href里的链接

6个链接 前三个符合条件 正则怎么写(即链接中必须带有参数viewkey page viewtype category)

第二个和第三个链接相同 怎么去重复(python下)

问题解答

回答1:

# python 2.7import rea = ’’’<a target='blank'href='http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&amp;page=1&amp;viewtype=basic&amp;category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp;page=1&amp;viewtype=basic&amp;category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp;page=1&amp;viewtype=basic&amp;category=rf'></a><a target='blank'href='http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&amp'></a><a target='blank'href='http://a.b.c.d/abc'></a><a target='blank'href='http://a.b.c.d/123'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:

提取前三个链接:

links= re.findall(r’href='https://www.haobala.com/wenda/(.*?=rf)'’,l_string,re.S)

去重:

new_links=set(links)

标签: Python 编程
相关文章: