文章详情页

python - lxml.etree为什么会自动加上加上？

浏览：256日期：2022-06-27 17:32:13

问题描述

正在学习lxml，代码如下：

from lxml import etreetext = ’’’ <a target='_blank' href='https://itjuzi.com/company/60321'> 洋鼹鼠</a> <a href='https://itjuzi.com/investevents?scope=145'>电子商务</a> <a href='https://itjuzi.com/investevents?prov=天津'>天津</a> ’’’html = etree.HTML(text)print(etree.tostring(html,encoding=’utf-8’).decode(’utf-8’))

输出如下：

主要不理解为什么标签那里会出错呢？请问怎么解决这个问题？谢谢~

问题解答

回答1：

主要是因为

p元素内容分类 Flow content, palpable content.允许的内容 Phrasing content.允许的父元素任何接受flow content的元素

i元素Content catergories Flow content, phrasing content, palpable content.允许量 phrasing content.

很显然P元素的父元素应该是flow content类型的，然而i并不满足条件，也就是说这是不符合规范的。解决办法就是i直接换为p。

Python 编程

上一条：python小白关于类里面的方法获取变量失败的问题下一条：python3.x - Python not 运算符的问题

相关文章：

1. javascript - "CommonsChunkPlugin now only takes a single argument.。。。。2. redis sentinel怎么跑守护进程以及日志记录位置的？3. mysqld无法关闭4. css - transition 的使用?5. python 字符串匹配问题6. css - layer图标问题7. Discuz! Q 有人用过吗?8. javascript - RN项目iOS端真机测试账号无法登录！9. javascript - mongodb怎么设置用户的账户不重复？10. 请问各位java自带类的一些问题

python - lxml.etree为什么会自动加上加上</i>？