文章详情页

Python基于爬虫实现全网搜索并下载音乐

浏览：69日期：2022-06-27 18:25:03

现在写一篇博客总是喜欢先谈需求或者本内容的应用场景，是的，如果写出来的东西没有任何应用价值，确实也没有实际意义。今天的最早的需求是来自于如何免费[白嫖]下载全网优质音乐，我去b站上面搜索到了一个大牛做过的一个歌曲搜素神器，界面是这样的：

确实很好用的，而且涵盖了互联网上面大多数主流的音乐网站，涉及到的版本也很多，可谓大而全，但是一个技术人的追求远远不会如此，于是我就想去了解其中背后的原理，因为做过网络爬虫的人都知道，爬虫只能爬取某一页或者某些页的网站资源，所以我很好奇它背后是怎么实现的？笔者一直以来都是做的基于Python3.7版本的网络爬虫，所以本文也是基于此来学习记录的。首先爬取的网站不是对应的音乐网站，而是一个音乐直链搜索，那里汇聚了大多数音频音乐的解析功能，界面如下：

Python基于爬虫实现全网搜索并下载音乐

所以自制一个搜索引擎的思想也很直观了，那就是利用第三方的接口，直接对该服务器发起请求即可，然后将获取的数据进行解析保存。这里以最近比较火的歌曲“白月光与朱砂痣”下载为例：

Python基于爬虫实现全网搜索并下载音乐

解析的结果如上，获取的数据格式是json类型，并且除了要有歌名以外，还要有音乐平台。

源代码实现如下：

import requestsimport jsonpathimport os''' 1.url 2.模拟浏览器请求 3.解析网页源代码 4.保存数据'''def song_download(url,title,author): # 创建文件夹 os.makedirs('music',exist_ok=True) path = ’music{}.mp3’.format(title) print(’歌曲:{0}-{1},正在下载...’.format(title,author)) # 下载（这种读写文件的下载方式适合少量文件的下载） content = requests.get(url).content with open(file = title + author + ’.mp3’,mode=’wb’) as f: f.write(content) print(’下载完毕,{0}-{1},请试听’.format(title,author))def get_music_name(): ''' 搜索歌曲名称 :return: ''' name = input('请输入歌曲名称:') print('1.网易云:neteasen2.QQ:qqn3.酷狗:kugoun4.酷我:kuwon5.百度:baidun6.喜马拉雅:ximalaya') platfrom = input('输入音乐平台类型:') print('-------------------------------------------------------') url = ’https://music.liuzhijin.cn/’ headers = { 'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36', # 判断请求是异步还是同步 'x-requested-with':'XMLHttpRequest', } param = { 'input':name, 'filter':'name', 'type':platfrom, 'page': 1, } res = requests.post(url=url,data=param,headers=headers) json_text = res.json() title = jsonpath.jsonpath(json_text,’$..title’) author = jsonpath.jsonpath(json_text,’$..author’) url = jsonpath.jsonpath(json_text, ’$..url’) if title: songs = list(zip(title,author,url)) for s in songs: print(s[0],s[1],s[2]) print('-------------------------------------------------------') index = int(input('请输入您想下载的歌曲版本:')) song_download(url[index],title[index],author[index]) else: print('对不起，暂无搜索结果!')if __name__ == '__main__': get_music_name()演示一下运行效果：

Python基于爬虫实现全网搜索并下载音乐

然后文件下就会出现对应的歌曲.mp3文件

Python基于爬虫实现全网搜索并下载音乐

并且每次的歌曲检索都是在PyCharm专业版的控制台中进行的，这样的用户体验就非常糟糕，所以针对以上两个问题，我对源代码进行了改进。

# 导入模块from tkinter import *import requestsimport jsonpathimport osfrom urllib.request import urlretrieve# 2.功能实现''' 1.url 2.模拟浏览器请求 3.解析网页源代码 4.保存数据'''def song_download(url,title,author): # 创建文件夹 os.makedirs('music',exist_ok=True) path = ’music{}.mp3’.format(title) text.insert(END,’歌曲:{0}-{1},正在下载...’.format(title,author)) # 文本框滑动 text.see(END) # 更新 text.update() # 下载 urlretrieve(url,path) text.insert(END,’下载完毕,{0}-{1},请试听’.format(title,author)) # 文本框滑动 text.see(END) # 更新 text.update()def get_music_name(): ''' 搜索歌曲名称 :return: ''' name = entry.get() platfrom = var.get() # name = ’白月光与朱砂痣’ url = ’https://music.liuzhijin.cn/’ headers = { 'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36', # 判断请求是异步还是同步 'x-requested-with':'XMLHttpRequest', } param = { 'input':name, 'filter':'name', 'type':platfrom, 'page': 1, } res = requests.post(url=url,data=param,headers=headers) json_text = res.json() title = jsonpath.jsonpath(json_text,’$..title’) author = jsonpath.jsonpath(json_text,’$..author’) url = jsonpath.jsonpath(json_text, ’$..url’) print(title,author,url) song_download(url[0],title[0],author[0])# 1.用户界面# 创建画板root = Tk()# 设置窗口标题root.title(’全网音乐下载器’)# 设置窗口大小以及出现的位置root.geometry(’560x450+400+200’)# 标签组件label = Label(root,text='请输入下载的歌曲:',font=(’楷体’,20))# 定位与布局label.grid(row=0)# 输入框组件entry = Entry(root,font=(’宋体’,20))entry.grid(row=0,column=1)# 单选按钮var = StringVar()r1 = Radiobutton(root,text=’网易云’,variable=var,value=’netease’)r1.grid(row=1,column=0)r2 = Radiobutton(root,text=’QQ’,variable=var,value=’qq’)r2.grid(row=1,column=1)# 列表框text = Listbox(root,font=(’楷体’,16),width=50,height=15)text.grid(row=2,columnspan=2)# 下载按钮button1 = Button(root,text=’开始下载’,font=(’楷体’,15),command=get_music_name)button1.grid(row=3,column=0)button2 = Button(root,text=’退出程序’,font=(’楷体’,15),command=root.quit)button2.grid(row=3,column=1)# 显示界面root.mainloop()我们再来看看效果吧

Python基于爬虫实现全网搜索并下载音乐

这样加上了UI界面和部分代码优化之后，就可以通过.py代码打包成.exe文件发布给用户使用了。

以上就是Python基于爬虫实现全网搜索并下载音乐的详细内容，更多关于python 爬虫下载音乐的资料请关注好吧啦网其它相关文章！

Python 编程

上一条：Python3+SQLAlchemy+Sqlite3实现ORM教程下一条：Python LMDB库的使用示例

相关文章：

1. 封装一个vue中也可使用的uniapp的全局弹窗组件(任何页面都可以弹出)2. 利用CSS制作3D动画3. html清除浮动的6种方法示例4. XML入门的常见问题(四)5. javascript xml xsl取值及数据修改第1/2页6. WML语法大全与相关介绍第1/3页7. asp读取xml文件和记数8. HTML DOM setInterval和clearInterval方法案例详解9. 让chatgpt将html中的图片转为base64方法示例10. WMLScript的语法基础

排行榜

					
					vue实现表格合并功能
php设计模式之观察者模式实例详解【星际争霸游戏案例】
IntelliJ IDEA配置Tomcat服务器的方法
django model 条件过滤 queryset.filter(**condtions)用法详解
IntelliJ IDEA恢复删除文件的方法
聊聊Java中是什么方法导致的线程阻塞
Python如何转换字符串大小写
Java倒计时三种实现方式代码实例
php redis setnx分布式锁简单原理解析
Vue 组件注册全解析
python实现手势识别的示例（入门）
				

热门标签