文章详情页

python正则怎么提取域名

浏览：237日期：2022-06-28 09:49:42

问题描述

怎么用python正则从这段脚本中提取coggles.co.uk域名呢,望各路高手指点显示下身手...

问题解答

回答1：

正则实现的话只要保证你的标定/特征是唯一的就好。但是'url'这个标志又不是唯一的。这个时候@prolifes的方法是很好的。

如果一定要正则实现呢，要用到零宽断言（zero-width assertions），当然这个词的翻译比较直，带来很多误解。它其实意思是指定位置的匹配，位置的宽度就是0嘛。

这里我们可以看到我们所需的这个'url'在'location'里面，可以以此为位置信息。

代码如下：

re.search(’(?<=location).+?'url': '([^']+)'’, string, re.DOTALL).group(1)

稍微解释一下，(?<=location)这个地方就是指前面得有location。后面有的话这样写：(?=location)re.DOTALL这个是必须的，因为这些字符串已经跨行了。他的作用是将.的字符串匹配范围扩大，包含换行符。'([^']+)'这个地方是我的习惯，[^']意指所有非'的字符，这就匹配了双引号中所有的字符串。

回答2：

这是一段挺标准的json，粗暴一点，直接转换成json

import jsonstr = ’’’<script type='application/ld+json'>{ '@context': 'http://schema.org', '@type': 'SaleEvent', 'name': '10% Off First Orders', 'url': 'https://www.myvouchercodes.co.uk/coggles', 'image': 'https://mvp.tribesgds.com/dyn/oh/Ow/ohOwXIWglMg/_/mQR5xLX5go8/m0Ys/coggles-logo.png', 'startDate': '2017-02-17', 'endDate': '2017-12-31', 'location': {'@type': 'Place','name': 'Coggles','url': 'coggles.co.uk','address': 'Coggles' }, 'description': 'Get the top branded fashion items from Coggles at discounted prices. Apply this code and enjoy savings on your purchase.', 'eventStatus': 'EventScheduled'}</script>’’’d = json.loads(re.search(’({[sS]*})’, str).group(1))print d[’location’][’url’]

Python 编程

上一条：javascript - js代码转python下一条：python - flask jinjia2 中怎么定义嵌套变量

相关文章：

1. docker-machine添加一个已有的docker主机问题2. docker-compose中volumes的问题3. nignx - docker内nginx 80端口被占用4. docker安装后出现Cannot connect to the Docker daemon.5. dockerfile - 为什么docker容器启动不了？6. angular.js - angularjs的自定义过滤器如何给文字加颜色？7. angular.js使用$resource服务把数据存入mongodb的问题。8. javascript - 移动端点击弹出遮罩层加断点调试就行不加断点就不行9. docker images显示的镜像过多，狗眼被亮瞎了，怎么办？10. javascript - 正则匹配字符串特定语句后的数字

排行榜

					
					nignx - docker内nginx 80端口被占用
docker-machine添加一个已有的docker主机问题
docker-compose中volumes的问题
docker安装后出现Cannot connect to the Docker daemon.
angular.js使用$resource服务把数据存入mongodb的问题。
debian - docker依赖的aufs-tools源码哪里可以找到啊？
dockerfile - 为什么docker容器启动不了？
angular.js - angularjs的自定义过滤器如何给文字加颜色？
docker images显示的镜像过多，狗眼被亮瞎了，怎么办？
javascript - 正则匹配字符串特定语句后的数字
javascript - 移动端 点击弹出遮罩层 加断点调试就行 不加断点就不行
				

热门标签