文章详情页

如何用Python一次性下载抖音上音乐

浏览：26日期：2022-06-19 15:37:34

目录Python 链接抖音爬虫实现分析热歌榜内容网页解析巧用eval代码实现Python 链接抖音

python下载抖音内容的帖子网上有一些，但都比较麻烦，需要通过adb连接安卓手机后，模拟操作。我这么懒，这种事儿玩不来…那么，该如何获取抖音内容呢？网上搜了下大概有两种方式，一个是浏览器插件快抖，另外一个是我今天要说的抖音网页版。其实这两者差别不是很大，都是先将抖音内容下载至服务器后，通过开发简单网站配置域名后，让大家访问。让我们来看看抖音网页版：

如何用Python一次性下载抖音上音乐

爬虫实现分析热歌榜内容

如何用Python一次性下载抖音上音乐

大家先开看看这个抖音热歌榜歌曲，每页20首歌曲，一个55页。但细不细心大家都能发现，很多歌曲存在重复的问题。所以，等下爬虫的时候，我们需要先准备一个music_list,用来识别这首歌曲是否已经下载过了…

网页解析

如何用Python一次性下载抖音上音乐

网页比较简单，一个div中包裹了一个ul>li*20,我们是不是该这样获取：

soup.find(’div’,{'class':'pull-left'}).find(’ul’).findAll(’a’)

如果你说是，那么一定没有好好看我前天整理的文章通过哪吒豆瓣影评，带你分析python爬虫快速入门:https://www.jianshu.com/p/ae38f7607902，我在文章中专门提到了一个小技巧，通过使用attr的属性进行快速解析，那么最快速的获取方式是：

soup.findAll(’a’, attrs={’onclick’: True})

我们只需要获取所有的a标签，切这些标签中包含onclick这个属性即可。

巧用eval

我们解析到的内容通过attr[‘onclick’],可以得到他的属性open1(‘夜’,’http://p9-dy.byteimg.com/obj/61a20007a98954b0831d)，如何能快速获取歌曲名字和url呢？这里我们需要用到一个eval的小技巧：

index = 'open1(’夜’,’http://p9-dy.byteimg.com/obj/61a20007a98954b0831d’,’’)'index[5:]'(’夜’,’http://p9-dy.byteimg.com/obj/61a20007a98954b0831d’,’’)'index_tuple = eval(index[5:])print(index_tuple, type(index_tuple))(’夜’, ’http://p9-dy.byteimg.com/obj/61a20007a98954b0831d’, ’’) <class ’tuple’>index_tuple[0]’夜’index_tuple[1]’http://p9-dy.byteimg.com/obj/61a20007a98954b0831d’

ps:今天一个朋友说我写代码没注释，我这是现身说法的告诉你，如何能写出让别人压根看不懂的代码，就是不写注释啊，哈哈！其实，代码我都在文章中一点一点的讲解了，所以没有写，但秉承着害怕大佬们取关的心态，我还是把注释加上吧…

代码实现

总体来说实现比较简单，全部代码如下：

import osimport requestsfrom bs4 import BeautifulSoupimport threadingimport timeclass DouYinMusic: def __init__(self):self.music_list = []self.path = self.download_path() @staticmethod def download_path():'''获取代码执行目录，并在目录下创建Music文件夹:return Music文件夹全路径'''base_dir = os.path.dirname(os.path.abspath(__file__))_path = os.path.join(base_dir, 'Music')if not os.path.exists(_path): os.mkdir(_path)return _path def get_request(self, url):'''封装requests.get方法如果为网页请求，返回网页内容否则，解析音乐地址，并返回音乐二进制文件:param url: 请求url（分网页、音乐两类）:return: 网页内容 & 音乐二进制文件'''r = requests.get(url, timeout=5)if url.endswith(’html’): return r.textelse: return r.content def analysis_html(self, html):'''根据获取的网页内容，解析音乐名称、下载地址调用音乐下载方法:param html: 网页内容'''soup = BeautifulSoup(html, ’lxml’)# 根据关键字onclick查找每个下载地址for tag_a in soup.findAll(’a’, attrs={’onclick’: True}): # 下载格式’('name','link','')’,通过eval将str转化为tuple类型 link_list = eval(tag_a[’onclick’][5:]) music_name, music_link = link_list[:2] # 因为存在部分重复音乐，故设置判断下载过的音乐跳过 if music_name in self.music_list:continue self.music_list.append(music_name) t = threading.Thread(target=self.download_music, args=(music_name, music_link)) time.sleep(0.5) t.start() def download_music(self, music_name, music_link):'''解析音乐文件,完成音乐下载:param music_name: 音乐名称:param music_link: 下载地址'''_full_name = os.path.join(self.path, music_name)with open(_full_name + ’.mp3’, ’wb’) as f: f.write(self.get_request(music_link))print('抖音音乐：{} 下载完成'.format(music_name)) def run(self):'''主方法，用于批量生成url'''for page in range(1,55): url = 'http://douyin.bm8.com.cn/t_{}.html'.format(page) html = self.get_request(url) self.analysis_html(html)if __name__ == ’__main__’: main = DouYinMusic() main.run()

来让我们看看效果吧：

如何用Python一次性下载抖音上音乐

网站是通过nginx负载均衡搭建的，有一些链接已经失效了。最终下载了不重复的592首抖音音乐。

如何用Python一次性下载抖音上音乐

同样的，大家喜欢可以按照这种方法，尝试下载一下网站的抖音视频。

以上就是如何用Python一次性下载抖音上音乐的详细内容，更多关于Python一次性下载抖音上音乐的资料请关注好吧啦网其它相关文章！

抖音 Python

上一条：Python自动安装第三方库的小技巧(pip使用详解)下一条：python处理emoji表情(两个函数解决两者之间的联系)

相关文章：

1. ASP.NET MVC使用jQuery的Load方法加载静态页面及注意事项2. TypeScript十大排序算法插入排序实现示例详解3. ASP.NET延迟调用或多次调用第三方Web API服务4. 原生js XMLhttprequest请求onreadystatechange执行两次的解决5. 让chatgpt将html中的图片转为base64方法示例6. 爬取今日头条Ajax请求7. Vue Element UI 表单自定义校验规则及使用8. 使用Node.js实现Clean Architecture方法示例详解9. XML文档搜索使用小结10. JSP实现带查询条件的通用分页组件

排行榜

					
					原生js XMLhttprequest请求onreadystatechange执行两次的解决
让chatgpt将html中的图片转为base64方法示例
AJAX实现指定部分页面刷新效果
ASP.NET MVC使用jQuery的Load方法加载静态页面及注意事项
JSP实现带查询条件的通用分页组件
XML文档搜索使用小结
ASP.NET延迟调用或多次调用第三方Web API服务
Vue Element UI 表单自定义校验规则及使用
Asp.Net部署Docker-v指令使用详解
使用Node.js实现Clean Architecture方法示例详解
TypeScript十大排序算法插入排序实现示例详解
				

热门标签