文章详情页

python - pyspider翻页问题？

浏览：102日期：2022-08-18 18:47:48

问题描述

想要爬取爱卡汽车的每个汽车的口碑，但是在翻页问题总是进不去，无论是用chorme还是自带的css selector helper抓取到的CSS PATH都无法翻页，请求帮助，代码如下

#!/usr/bin/env python# -*- encoding: utf-8 -*-# Created on 2017-03-21 12:57:03# Project: test03import refrom pyspider.libs.base_handler import *class Handler(BaseHandler): crawl_config = { } @every(minutes=24 * 60) def on_start(self):self.crawl(’http://newcar.xcar.com.cn/price/’, callback=self.index_page) @config(age=10 * 24 * 60 * 60) def index_page(self, response):for each in response.doc(’a[href^='http']’).items(): if re.match('http://newcar.xcar.com.cn/d', each.attr.href, re.U): self.crawl(each.attr.href, callback=self.list_page) def list_page(self, response):for each in response.doc(’body > p.demio_wp > p > ul > li:nth-child(6) > a’).items(): self.crawl(each.attr.href, callback=self.list_page1)def list_page1(self, response):for each in response.doc(’.review_gml_tit > .more’).items(): self.crawl(each.attr.href, callback=self.detail_page) #翻页，问题出在下面这里for each in response.doc(’body > p.review_main > p.review_left > p > p.review_comments > p.review_comments_dl > p.pagers > a:nth-child(2)’).items(): self.crawl(each.attr.href, callback=self.list_page1)@config(priority=2) def detail_page(self, response):return { 'branch':response.doc(’#nav_ps > em > a’).text(), 'text':response.doc(’body > p.review_main > p.review_left > p > p.review_comments > p.review_comments_dl > dl > dd’).text(), }

问题解答

回答1：

评论是 javascript 加载的。

Python 编程

上一条：Python3的CSV模块怎样可以把数据存储到WPS中下一条：算法 - python 给定一个正整数a和一个包含任意个正整数的列表 b，求所有<=a 的加法组合

相关文章：

1. Docker for Mac 创建的dnsmasq容器连不上/不工作的问题2. python - beautifulsoup获取网页内容的问题3. docker-machine添加一个已有的docker主机问题4. docker - 如何修改运行中容器的配置5. angular.js - Angular 2 + Django构建的Web应用, 如何合理搭配 ?6. android - 如何使用view group的bitmap做一个倒影效果，同时忽略scale的view7. android studio总是在processes running好久8. angular.js - angular2 属性组件与控件组件之间如何通信9. java - 请问在main方法中写成对象名.属性（）并赋值，与直接参参数赋值输错误是什么原因？10. angular.js - 在终端中用yeoman启用angular-generator报错，求解？

排行榜

					
					Docker for Mac 创建的dnsmasq容器连不上/不工作的问题
python - beautifulsoup获取网页内容的问题
docker - 如何修改运行中容器的配置
docker-machine添加一个已有的docker主机问题
怎么用css截取字符？
dockerfile - [docker build image失败- npm install]
docker镜像push报错
docker不显示端口映射呢？
Android "1"=="1" 到底是true还是false
angular.js - 在终端中用yeoman启用angular-generator报错，求解？
android - 如何使用view group的bitmap做一个倒影效果，同时忽略scale的view
				

热门标签