文章详情页

javascript - node爬取微博

浏览：238日期：2022-06-24 14:18:08

问题描述

刚接触node,想写个爬虫，爬取新浪微博评论，但是发现页面是由JS动态生成的，用http模块爬取不到，然后用phantomjs爬取，（听说会比较慢，运行了近15分钟，这也太慢了，不知是否写错），还是不行，问一下有什么办法能够爬取类似于新浪微博的网页吗？

问题解答

回答1：

自己写过微博的爬取,有两种思路

仔细看一下应该是有接口去获取相应数据的然后用正则去匹配

微博提供了开发者API接口的,虽然用着比较麻烦

微博

上一条：javascript - 微信小程序调用外部地图程序下一条：javascript - vue-cli项目中，获取微信access_token时遇到的跨域问题

相关文章：

1. docker绑定了nginx端口外部访问不到2. python - 使用pandas的resample报错3. android - 类似于微信朋友圈图片这样的是在listview中嵌套gridview还是动态加入多个imageview呢？4. python - flask post提交timestamp不能作为参数，这是为什么？5. docker-machine添加一个已有的docker主机问题6. vue.js - vue-router开启HTML5的history模式后nginx配置7. 网页爬虫 - python 爬取网站并解析非json内容8. html - 类似这样的弹层用什么插件写比较好？9. html5 - 图片一般一怎么的形式存放在服务器中的？10. 使用list和each配合，的作业，输出一行后，如何换行

排行榜

					
					docker绑定了nginx端口 外部访问不到
python - 使用pandas的resample报错
docker-machine添加一个已有的docker主机问题
python - flask post提交timestamp不能作为参数，这是为什么？
android - 类似于微信朋友圈图片这样的是在listview中嵌套gridview还是动态加入多个imageview呢？
html - 类似这样的弹层用什么插件写比较好？
html5 - 图片一般一怎么的形式存放在服务器中的？
vue.js - vue-router开启HTML5的history模式后nginx配置
网页爬虫 - python 爬取网站 并解析非json内容
IOS app应用软件的id号怎么查询？比如百度贴吧的app-id=477927813
nignx - docker内nginx 80端口被占用
				

热门标签