文章详情页

python - Scrapy的使用，如何请求新的URL，并回调指定的函数？

浏览：219日期：2022-06-27 13:56:42

问题描述

关于Python3下Scrapy的使用问题

import reimport scrapyfrom bs4 import BeautifulSoupfrom scrapy.http import Requestfrom ..items import ZhibobaItemimport jsonimport lxml.htmlimport requestsimport jsonclass Myspider(scrapy.Spider): name = ’zhiboba’ allowed_domains = [’zhibo8.cc’] json_url = ’https://bifen4pc.qiumibao.com/json/list.htm?85591’ bash_url = ’https://www.zhibo8.cc/’ def start_requests(self):yield Request(self.bash_url, self.parse_index) def parse_index(self, response):print('enter the parse_index')print(self.bash_url)ps = BeautifulSoup(response.text, ’lxml’).find_all(label=re.compile('足球'))item = ZhibobaItem()for single_p in ps: item[’label’] = single_p.get(’label’) item[’sdate’] = single_p.get(’data-time’) item[’linkurl’] = self.bash_url + single_p.find(’a’)[’href’] home_team = single_p.get_text().split()[2] item[’home_team’] = home_team visit_team = single_p.get_text().split()[4] item[’visit_team’] = visit_team print('quit the parse_index') print(self.json_url) yield Request(self.json_url, callback=self.get_score, meta={’home_team’: home_team, ’visit_team’: visit_team }) def get_score(self, response):print('enter the get_score')json_url = self.json_urlwbdata = response.get(json_url).textdata = json.loads(wbdata)news = data[’list’]print(wbdata)print('quit the get_score')

当我执行上述代码时，无法成功的调用json_url以及相应的响应函数get_score，哪里不对？

问题解答

回答1：

试着修改allow_domains = []。

Python 编程

上一条：python - 网站对账号访问频率限制下一条：【python小白】问关于__new__方法的作用的问题

排行榜

					
					docker - 如何修改运行中容器的配置
为什么我ping不通我的docker容器呢？？？
docker镜像push报错
golang - 用IDE看docker源码时的小问题
angular.js - angular内容过长展开收起效果
关于phpstudy设置主从数据库
docker-compose 为何找不到配置文件？
javascript - 正则匹配字符串特定语句后的数字
css3 - IE浏览器下，一个元素设置overflow:auto后，出现下拉滚动条，拖动滚动条图片会移动，但文字不移动
javascript - 关于数组的循环遍历问题
在cmd下进入mysql数据库，可以输入中文，但是查看表信息，不显示中文，是怎么回事，怎新手，请老师
				

热门标签