java - 如何用正则提取html内容
问题描述
<p class='info-detail-head-classify-subname'><a href='https://www.haobala.com/wenda/11492.html' target='_blank'>财富</a></p> 想用java 提取财富两个字 请问用正则怎么提取 用jsoup会不会简单一点
问题解答
回答1:可以使用jsoup和regex, 推荐使用jsoup!jsoup document:https://jsoup.org/cookbook/in...http://www.open-open.com/jsoup/
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element;import java.util.regex.Matcher; import java.util.regex.Pattern;public class Main { public static void main(String[] args) {// 方法1: jsoup String html = '<p class='info-detail-head-classify-subname'><a href='https://www.haobala.com/wenda/11492.html' target='_blank'>财富</a></p>';Document doc = Jsoup.parse(html); Element element = doc.getElementById('info_detail_head_classify_type'); System.out.println(element.text());// 方法2: regex Pattern r = Pattern.compile('<a.*>(.*)</a>'); Matcher m = r.matcher(html); if (m.find()) {System.out.println(m.group(1)); }} }回答2:
<a[^>]*>([^<]*)</a>
取<a></a>中的内容
相关文章:
1. docker-machine添加一个已有的docker主机问题2. dockerfile - 我用docker build的时候出现下边问题 麻烦帮我看一下3. angular.js - angularjs的自定义过滤器如何给文字加颜色?4. 关docker hub上有些镜像的tag被标记““This image has vulnerabilities””5. 请问怎么改变超链接字体的颜色?6. docker网络端口映射,没有方便点的操作方法么?7. angular.js - angular2 有什么cool的loading组件么?8. docker内创建jenkins访问另一个容器下的服务器问题9. java - 做数据库向手机端的推送要系统地学习哪些知识?求大神指点,谢谢!10. java编程思想第4版中文版的几处谬误?
![docker-machine添加一个已有的docker主机问题](http://www.haobala.com/attached/image/news/202311/1028320972.png)