文章详情页
关于python爬虫的问题
问题描述
我使用post爬取网页表格数据,网站如下http://www.ipe.org.cn/Industr...,现在遇到了2个问题,其中一个问题是违规类型中<input type='checkbox' name='violation' data-role='all' checked='' value='0'>,该网页已经设定了checked,已经有默认值,而我只想要violation=1的数据,不知道该怎么办第二个问题是在选择国家,省份,城市过程<select name='select' onchange='setProvince_0();'>我无法直接用name 以及value选择我想要的表单数据
跪求各位大神的解答
问题解答
回答1:他是有API用来返回数据的,你可以抓取一下,点击筛选之后的数据流。大概是这个api,http://www.ipe.org.cn/data_as...,post方式,里面有一个参数叫itemType就是你想要的违规类型。然后对应的国家,省份,城市等信息都在api中有体现,自己跟一下就知道了。然后根据需求,构造请求你需要的数据,剩下的就是解析了。。。。
相关文章:
1. docker不显示端口映射呢?2. 关docker hub上有些镜像的tag被标记““This image has vulnerabilities””3. 网页爬虫 - python爬虫翻页问题,请问各位大神我这段代码怎样翻页,还有价格要登陆后才能看到,应该怎么解决4. nignx - docker内nginx 80端口被占用5. 在windows下安装docker Toolbox 启动Docker Quickstart Terminal 失败!6. dockerfile - 我用docker build的时候出现下边问题 麻烦帮我看一下7. golang - 用IDE看docker源码时的小问题8. python在list相加 求助9. mac连接阿里云docker集群,已经卡了2天了,求问?10. node.js - node中MYSQL的异步问题
排行榜