文章详情页

使用python爬取taptap网站游戏截图的步骤

浏览：143日期：2022-06-20 15:19:26

今天使用python写了一个简单的爬虫，用来下载taptap网站的游戏截图。下面说下具体的实现方法。

在搜索框中搜索“原神”

打开浏览器的开发者选项，从详情按钮里面跳转到游戏的页面，点击详情之后，跳转页面

使用python爬取taptap网站游戏截图的步骤

这时候看到，浏览器地址：https://www.taptap.com/app/168332，tap官网的域名加上app/和图一的游戏id，可以使用re模块正则表达式模块从接口中获取到这个id

x_ua = ’V=1&PN=WebApp&LANG=zh_CN&VN_CODE=4&VN=0.1.0&LOC=CN&PLT=PC&DS=Android&UID=97bb961f-bf03-4c7a-8cd7-8d6d8655d9c8&DT=PC’def search(game_name): '''根据游戏名搜索提取出游戏id''' url = ’https://www.taptap.com/webapiv2/mix-search/v1/by-keyword’ data = {’kw’: f’{game_name}’,’X-UA’ : x_ua# ’X-UA’: ’V=1&PN=WebApp&LANG=zh_CN&VN_CODE=4&VN=0.1.0&LOC=CN&PLT=PC&DS=Android&UID=97bb961f-bf03-4c7a-8cd7-8d6d8655d9c8&DT=PC’ } r = requests.get(url=url, params=data) pattern = re.compile(’'type':'app','identification':'app:(.+?)'’, re.S) r1 = pattern.findall(r.text) #从response中提取游戏id return r1[0]

然后打开开发者选项观察接口，可以从这个接口中获取到游戏截图的链接，

使用python爬取taptap网站游戏截图的步骤

把数据json格式化一下，可以发现在data下，'screenshots'下的“orignal_url”就是截图的链接。使用json.load转换成字典，就可以比较方便的取出内容了。

使用python爬取taptap网站游戏截图的步骤

url = f’https://www.taptap.com/webapiv2/app/v2/detail-by-id/{search(game_name)}’ r = requests.get(url=url, params={’X-UA’: x_ua}) data = json.loads(r.text) #转换为字典格式 original_url = data.get(’data’).get(’screenshots’) #提取出截图url

之后使用一个循环将图片保存到本地

for i in original_url: time.sleep(0.5) game_original_url = i.get(’original_url’) print(game_original_url, type(game_original_url)) respones = requests.get(game_original_url) img = respones.content file_name = game_original_url[-36: -4] screenshots = os.path.join(os.path.dirname(__file__), f’screenshots/{game_name}’) if not os.path.exists(screenshots):os.makedirs(screenshots) file_path = os.path.join(screenshots, file_name) with open(file_path + ’.png’, ’wb’) as f:f.write(img)

完整代码：

import osimport requestsimport jsonimport reimport timex_ua = ’V=1&PN=WebApp&LANG=zh_CN&VN_CODE=4&VN=0.1.0&LOC=CN&PLT=PC&DS=Android&UID=97bb961f-bf03-4c7a-8cd7-8d6d8655d9c8&DT=PC’def search(game_name): '''根据游戏名搜索提取出游戏id''' url = ’https://www.taptap.com/webapiv2/mix-search/v1/by-keyword’ data = {’kw’: f’{game_name}’,’X-UA’ : x_ua# ’X-UA’: ’V=1&PN=WebApp&LANG=zh_CN&VN_CODE=4&VN=0.1.0&LOC=CN&PLT=PC&DS=Android&UID=97bb961f-bf03-4c7a-8cd7-8d6d8655d9c8&DT=PC’ } r = requests.get(url=url, params=data) pattern = re.compile(’'type':'app','identification':'app:(.+?)'’, re.S) r1 = pattern.findall(r.text) #从response中提取游戏id return r1[0]def download_screenshots(game_name): url = f’https://www.taptap.com/webapiv2/app/v2/detail-by-id/{search(game_name)}’ r = requests.get(url=url, params={’X-UA’: x_ua}) data = json.loads(r.text) #转换为字典格式 original_url = data.get(’data’).get(’screenshots’) #提取出截图url try:for i in original_url: time.sleep(0.5) game_original_url = i.get(’original_url’) print(game_original_url, type(game_original_url)) respones = requests.get(game_original_url) img = respones.content file_name = game_original_url[-36: -4] screenshots = os.path.join(os.path.dirname(__file__), f’screenshots/{game_name}’) if not os.path.exists(screenshots):os.makedirs(screenshots) file_path = os.path.join(screenshots, file_name) with open(file_path + ’.png’, ’wb’) as f:f.write(img) except:print(’下载失败’)if __name__ == ’__main__’: download_screenshots(’lol’)

以上就是使用python爬取taptap游戏截图的步骤的详细内容，更多关于使用python爬取taptap游戏截图的资料请关注好吧啦网其它相关文章！

Python 编程

上一条：python3 lambda表达式详解下一条：用Python给图像算法做个简单应用界面

相关文章：

1. asp.net core服务限制堆内存大小的操作方法2. 解决Django响应JsonResponse返回json格式数据报错问题3. Python爬取12306车次信息代码详解4. python 制作python包,封装成可用模块教程5. python怎么运行代码6. Python使用paramiko连接远程服务器执行Shell命令的实现7. 解决python脚本中error: unrecognized arguments: True错误8. Python文字截图识别OCR工具实例解析9. Python 实现将某一列设置为str类型10. 通过vue如何设置header

排行榜

					
					Python爬取12306车次信息代码详解
asp.net core服务限制堆内存大小的操作方法
python 制作python包,封装成可用模块教程
解决Django响应JsonResponse返回json格式数据报错问题
VMware如何进入BIOS方法
Java MultipartFile实现上传文件/上传图片
java实现简单的扫雷小游戏
JAVA用递归实现全排列算法的示例代码
IntelliJ IDEA创建普通的Java 项目及创建 Java 文件并运行的教程
Java基础之容器Vector详解
基于JS+HTML实现弹窗提示是否确认提交功能
				

热门标签