文章详情页

java如何爬取js处理后的代码

浏览：195日期：2023-12-07 11:18:37

问题描述

页面地址: http://acm.hdu.edu.cn/showpro...

爬取的目标: java如何爬取js处理后的代码

想要爬取这些个公式的代码，Chrome按F12看到的代码: java如何爬取js处理后的代码

但是爬取到的代码如下:

java如何爬取js处理后的代码

这个代码并不能显示正确的公式，貌似这些代码都是js生成的，该如何爬取到这些代码。

问题解答

回答1：

这是MathJax工具解析的。在HTML代码中查看公式p的下一个id为MathJax-Element-X的script，复制里面的内容，在公式前后加两个$$（前后都是两个美元符，所以一共是四个）最后使用MathJax解析就可以了。说再多不如上图： java如何爬取js处理后的代码

java如何爬取js处理后的代码

回答2：

先抓包，把ajax请求抓出来，关键是看怎么构造该请求，主要是一些参数的确定。套路大概下面几个:1 在上下文搜搜相关参数是否存在，如果是服务器返回的，就直接请求服务器获得该参数；2 如果该参数很明显不变或者变化有规律，可以直接伪造；3 如果参数很复杂且没规律，那么需要搜索参数的key,找到加密的js，然后构造参数的值，得到ajax url；4 实在难度太大那么用selenium等自动化工具驱动浏览器来访问，它会直接给你渲染好所有js

java

上一条：java - 第13行代码看不太懂，sb和str不是同一个类型啊？下一条：java - web 应用分层理解

相关文章：

1. docker内创建jenkins访问另一个容器下的服务器问题2. angular.js - angular内容过长展开收起效果3. 为什么我ping不通我的docker容器呢？？？4. dockerfile - 为什么docker容器启动不了？5. debian - docker依赖的aufs-tools源码哪里可以找到啊？6. docker - 各位电脑上有多少个容器啊？容器一多，自己都搞混了，咋办呢？7. 对html实现监测发现不对8. 在mac下出现了两个docker环境9. docker 17.03 怎么配置 registry mirror ?10. javascript - js中向下取整

排行榜

					
					为什么我ping不通我的docker容器呢？？？
debian - docker依赖的aufs-tools源码哪里可以找到啊？
dockerfile - 为什么docker容器启动不了？
angular.js - angular内容过长展开收起效果
docker - 各位电脑上有多少个容器啊？容器一多，自己都搞混了，咋办呢？
对html实现监测  发现不对
docker内创建jenkins访问另一个容器下的服务器问题
android - Apk 中找不到r类文件
angular.js使用$resource服务把数据存入mongodb的问题。
docker - 如何修改运行中容器的配置
angular.js - angularjs的自定义过滤器如何给文字加颜色？
				

热门标签