json - python中用正则表达式去掉字符串中的冒号
问题描述
初学python,最近尝试爬数据,json字符串的value中有冒号,需要去掉。我的代码如下。 a和b都是value中会有冒号的字符串
import rea = 'Title:’Intern: Customer Experience + Innovation (CX+I) Intern Brands’'b = 'cmp:’Adecco: USA’,cmpesc:’Adecco: USA’'result = re.sub(’^(?:Title|cmp|cmpesc):.+(:)’,’’, a)
代码执行结果是只剩 Customer Experience + Innovation (CX+I) Intern Brands’,之前的内容全被删除了,而我想要的效果是只删intern之后的那个冒号(title后的冒号要保留)。请问大家该如何修改?
问题解答
回答1:import reresult = re.sub(’^(Title|cmp|cmpesc:)(.+):(.*)’,’123’,'Title:’Intern: Customer Experience + Innovation (CX+I) Intern Brands’')print(result) # Title:’Intern Customer Experience + Innovation (CX+I) Intern Brands’回答2:
这样的话:
’’.join(re.split(’(?<![Title|cmp|cmpesc]):’,a))
就好了
回答3:果然是我看错题目了....
回答4:不用去掉冒号,直接变成字典就行了~
>>> a = 'Title:’Intern: Customer Experience + Innovation (CX+I) Intern Brands’';b = 'cmp:’Adecco: USA’,cmpesc:’Adecco: USA’'>>> dict([s.split(’:’,1) for s in a.split(’,’)]){’Title’: '’Intern: Customer Experience + Innovation (CX+I) Intern Brands’'}>>> dict([s.split(’:’,1) for s in b.split(’,’)]){’cmpesc’: '’Adecco: USA’', ’cmp’: '’Adecco: USA’'}>>>
写成函数
a = 'Title:’Intern: Customer Experience + Innovation (CX+I) Intern Brands’'b = 'cmp:’Adecco: USA’,cmpesc:’Adecco: USA’'def fn(x): return dict((s.split(’:’,1) for s in x.replace('’','').split(’,’)))print(fn(a))print(fn(b))# {’Title’: ’Intern: Customer Experience + Innovation (CX+I) Intern Brands’}# {’cmp’: ’Adecco: USA’, ’cmpesc’: ’Adecco: USA’}
相关文章:
1. javascript - js判断一个数组是否重复2. python相关问题求解决,有偿3. python3.x - mongodb 显示不出中文,都是方块,该如何解决?4. javascript - prismplayer播放器全屏问题5. javascript - js 修改表格元素的,可以用DOM操作实现吗?6. javascript - Chrome 扩展,更新别人的扩展 能不能上传到插件商店?7. javascript - 这种上传图片预览怎么做?8. javascript - input输入框触发change事件后,外部元素会被选中9. javascript - 在sublime中如何给.vue文件注释?10. javascript - js如何捕获到Uncaught (in promise) TypeError这样的异步错误?