文章详情页

python爬取抖音视频的实例分析

【字号：大中小】日期：2022-06-29 15:14:22浏览：2作者：猪猪

现在抖音的火爆程度，大家都是有目共睹的吧，之前小编在网络上发现好玩的事情，就是去爬取一些网站，因此，也考虑能否进行抖音上的破案去，在实际操作以后，真的实现出来了，利用自动化工具，就可以轻松实现了，后有小伙伴提出把appium去掉瘦身之后也是可以实现的，那么看下详细操作内容吧。

1、mitmproxy/mitmdump抓包

import requestspath = ’D:/video/’num = 1788def response(flow): global num target_urls = [’url’] for url in target_urls: if flow.request.url.startswith(url): filename = path + str(num) + ’.mp4 res = requests.get(flow.request.url, stream=True) with open(filename, ’ab’) as f: f.write(res.content) f.flush() print(filename + ’下载完成’) num += 1

2、Appium对手机进行模拟操作

利用Start Server按钮即可启动appium服务

python爬取抖音视频的实例分析

再点击Start Session即可启动Android手机上的抖音app并进入到启动页面

3、python脚本来驱动app，直接在pycharm运行即可

实例扩展：

import requestsimport jsonimport reimport osfrom pprint import pprint as ppimport queueclass DouYin: header = { ’accept’: ’text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8’, ’accept-encoding’: ’gzip, deflate, br’, ’accept-language’: ’zh-CN,zh;q=0.9’, ’cache-control’: ’max-age=0’, ’upgrade-insecure-requests’: ’1’, ’user-agent’: ’Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1’, } def __init__(self, url=None): self.url = self.get_RealAddress(url) # 获取用户视频的url self.user_video_url = ’https://www.douyin.com/aweme/v1/aweme/post/?{0}’ self.user_id = re.search(r’user/(.*)?’, self.url).group(1)# 用户id requests.packages.urllib3.disable_warnings() self.session = requests.Session() self.target_folder = ’’# 创建文件的路径 self.queue = queue.Queue()# 生成一个队列对象 def user_info(self): self.mkdir_dir() p = os.popen(’node fuck.js %s’ % self.user_id) # 获取加密的signature signature = p.readlines()[0] user_video_params = { ’user_id’: str(self.user_id), ’count’: ’21’, ’max_cursor’: ’0’, ’aid’: ’1128’, ’_signature’: signature } # 获取下载视频的列表 def get_aweme_list(max_cursor=None): if max_cursor: user_video_params[’max_cursor’] = str(max_cursor) user_video_url = self.user_video_url.format( ’&’.join([key + ’=’ + user_video_params[key] for key in user_video_params])) # 拼接参数 response = requests.get( url=user_video_url, headers=self.header, verify=False) contentJson = json.loads(response.content.decode(’utf-8’)) # 将返回的进行utf8编码 aweme_list = contentJson.get(’aweme_list’, []) for aweme in aweme_list: video_name = aweme.get( ’share_info’, None).get(’share_desc’, None) # 视频的名字 video_url = aweme.get(’video’, None).get(’play_addr’, None).get( ’url_list’, None)[0].replace(’playwm’, ’play’) # 视频链接 self.queue.put((video_name, video_url)) # 将数据进队列 if contentJson.get(’has_more’) == 1: # 判断后面是不是还有是1就是还有 return get_aweme_list(contentJson.get(’max_cursor’)) # 有的话获取参数max_cursor get_aweme_list() # 下载视频 def get_download(self): while True: video_name, video_url = self.queue.get() file_name = video_name + ’.mp4’ file_path = os.path.join(self.target_folder, file_name) if not os.path.isfile(file_path): print(’download %s form %s.n’ % (file_name, video_url)) times = 0 while times < 10: try: response = requests.get( url=video_url, stream=True, timeout=10, verify=False) # 开启流下载 with open(file_path, ’wb’) as f: for chunk in response.iter_content(1024): # 返回迭代对象f.write(chunk) print(’下载成功’) break except: print(’下载失败’) times += 1 # 创建对应的文件夹 def mkdir_dir(self): current_folder = os.getcwd() self.target_folder = os.path.join( current_folder, ’download/%s’ % self.user_id) if not os.path.isdir(self.target_folder): os.mkdir(self.target_folder) # 短链接转长地址 def get_RealAddress(self, url): if url.find(’v.douyin.com’) < 0: return url response = requests.get( url=url, headers=self.header, allow_redirects=False) # allow_redirects 允许跳转 return response.headers[’Location’]if __name__ == ’__main__’: douyin = DouYin(url=’http://v.douyin.com/J2B9Sk/’) douyin.user_info() douyin.get_download()

到此这篇关于python爬取抖音视频的实例分析的文章就介绍到这了,更多相关如何使用python爬取抖音视频内容请搜索好吧啦网以前的文章或继续浏览下面的相关文章希望大家以后多多支持好吧啦网！

抖音 Python

上一条：python 自动识别并连接串口的实现下一条：python中的插入排序的简单用法

相关文章：

1. asp画中画广告插入在每篇文章中的实现方法2. PHP的FTP学习（一）3. 在Asp.net core项目中使用WebSocket4. JavaScript实现组件化和模块化方法详解5. ASP.NET MVC使用异步Action的方法6. 将properties文件的配置设置为整个Web应用的全局变量实现方法7. PHP字符串前后字符或空格删除方法介绍8. XML入门精解之结构与语法9. .Net Core和RabbitMQ限制循环消费的方法10. Javaweb工程运行报错HTTP Status 404解决办法

排行榜

					
					将properties文件的配置设置为整个Web应用的全局变量实现方法
PHP的FTP学习（一）
PHP字符串前后字符或空格删除方法介绍
XML入门精解之结构与语法
ASP.NET MVC使用异步Action的方法
asp画中画广告插入在每篇文章中的实现方法
在Asp.net core项目中使用WebSocket
JavaScript实现组件化和模块化方法详解
SpringMVC+Jquery实现Ajax功能
python imutils包基本概念及使用
matplotlib如何设置坐标轴刻度的个数及标签的方法总结
				

热门标签