java - 如何用正则提取html内容
问题描述
<p class='info-detail-head-classify-subname'><a href='https://www.haobala.com/wenda/11492.html' target='_blank'>财富</a></p> 想用java 提取财富两个字 请问用正则怎么提取 用jsoup会不会简单一点
问题解答
回答1:可以使用jsoup和regex, 推荐使用jsoup!jsoup document:https://jsoup.org/cookbook/in...http://www.open-open.com/jsoup/
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element;import java.util.regex.Matcher; import java.util.regex.Pattern;public class Main { public static void main(String[] args) {// 方法1: jsoup String html = '<p class='info-detail-head-classify-subname'><a href='https://www.haobala.com/wenda/11492.html' target='_blank'>财富</a></p>';Document doc = Jsoup.parse(html); Element element = doc.getElementById('info_detail_head_classify_type'); System.out.println(element.text());// 方法2: regex Pattern r = Pattern.compile('<a.*>(.*)</a>'); Matcher m = r.matcher(html); if (m.find()) {System.out.println(m.group(1)); }} }回答2:
<a[^>]*>([^<]*)</a>
取<a></a>中的内容
相关文章:
1. MySQL的SELECT...FOR UPDATE究竟起什么作用2. windows-7 - win7下使用cmder,如何设置vim的tab为4个空格?3. Java。如何将文本追加到file.txt的顶部4. javascript - js对象 属性的访问和创建5. Java中的多人游戏。将客户端(玩家)连接到其他客户端创建的游戏6. java - socket类服务端如何防止被ddos攻击?7. javascript - phoneswipe点击图片怎么让图片全屏?8. 隐秘的“脚本错误”。在Chrome和Firefox中以Javascript报告9. c++ - win764位环境下,我用GCC为什么指针占8个字节,而long是4个字节?10. python - 有一个函数名(字符串形式),如何能够调用这个函数?

网公网安备