文章详情页

python - 为什么提取不到url编码的数据？

浏览：69日期：2022-07-03 10:35:28

问题描述

这是我的代码

source_ip = line.split(’ ’)[11].strip() if re.match(’[%w]+’,source_ip):if source_ip_dict.get(source_ip,’-’)==’-’: source_ip_dict[source_ip]=1else: source_ip_dict[source_ip]=source_ip_dict[source_ip]+1

这是日志里面的数据

106.39.191.230 - - [20/Apr/2017:15:41:06 +0800] 0 'GET /article/1056 HTTP/1.1' 302 - 'https://so.m.sm.cn/s?q=%E5%B0%8F%E7%BD%90%E8%8C%B6+%E5%90%A7&uc_param_str=dnntnwvepffrgibijbprsvdsme&from=ucframe&by=submit&snum=9&uc_sm=1' 'Mozilla/5.0 (Linux; U; Android 7.0; zh-CN; MI 5 Build/NRD90M) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/40.0.2214.89 UCBrowser/11.4.5.937 Mobile Safari/537.36'183.11.69.39 - - [20/Apr/2017:16:41:10 +0800] 0 'GET /article/810 HTTP/1.1' 200 8567 'https://www.sogou.com/link?url=DSOYnZeCC_oEIb3cp8Q2nRzAwnn3W-dXaJrgRIXUqR540kn4PqPKYQ..&query=%E5%93%81%E8%8C%B6%E5%94%AF%E7%BE%8E%E6%84%8F%E5%A2%83%E5%9B%BE%E7%89%87' 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.2604.400 QQBrowser/9.6.10875.400'183.224.69.81 - - [20/Apr/2017:16:53:18 +0800] 0 'GET /article/514441 HTTP/1.1' 200 11327 'http://www.so.com/link?url=http%3A%2F%2Fwww.testurl.com%2Farticle%2F514441&q=%E5%A4%A7%E7%9B%8A%E5%AE%9D%E7%9B%92&ts=1492678364&t=40b441f225a931eddb35fbcd0bc8a3c&src=haosou' 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'

为什么提取不到

%E5%A4%A7%E7%9B%8A%E5%AE%9D%E7%9B%92%E5%93%81%E8%8C%B6%E5%94%AF%E7%BE%8E%E6%84%8F%E5%A2%83%E5%9B%BE%E7%89%87%E5%B0%8F%E7%BD%90%E8%8C%B6+%E5%90%A7

正则写错了吗？还是哪里错了？要怎么修改

问题解答

回答1：

r’[%w]+’

Python 编程

上一条：python - 运行django的时候出现这个django.core.exceptions.ValidationError下一条：python - 为什么match匹配出来的结果是<_sre.SRE_Match object; span=(0, 54), match=’’>

相关文章：

1. sass - gem install compass 使用淘宝 Ruby 安装失败，出现 4042. javascript - js 对中文进行MD5加密和python结果不一样。3. mysql里的大表用mycat做水平拆分，是不是要先手动分好，再配置mycat4. window下mysql中文乱码怎么解决？？5. javascript - h5上的手机号默认没有识别6. python - （初学者）代码运行不起来，求指导，谢谢！7. html5 - H5 SSE的本质是什么？8. python - 获取到的数据生成新的mysql表9. python的文件读写问题？10. 为什么python中实例检查推荐使用isinstance而不是type？

排行榜

					
					为什么python中实例检查推荐使用isinstance而不是type？
java - 关于 controller层与service层如何传值？
html5 - H5 SSE的本质是什么？
怎么用css截取字符？
javascript - js 对中文进行MD5加密和python结果不一样。
视频 - html5 video的autoplay 在智能手機上不運作？
前端 - 请问display: -webkit-flex;是什么意思？
sass - gem install compass 使用淘宝 Ruby 安装失败，出现 404
android - WebView偶尔无法加载，没有发起请求
mysql里的大表用mycat做水平拆分，是不是要先手动分好，再配置mycat
javascript - 可以使用splice却无法使用substring
				

热门标签