文章详情页

python 爬取免费简历模板网站的示例

浏览：3日期：2022-07-09 17:14:52

代码

# 免费的简历模板进行爬取本地保存 # http://sc.chinaz.com/jianli/free.html# http://sc.chinaz.com/jianli/free_2.htmlimport requestsfrom lxml import etreeimport osdirName = ’./resumeLibs’if not os.path.exists(dirName): os.mkdir(dirName)headers = { ’User-Agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36’}url = ’http://sc.chinaz.com/jianli/free_%d.html’for page in range(1,2): if page == 1: new_url = ’http://sc.chinaz.com/jianli/free.html’ else: new_url = format(url%page) page_text = requests.get(url=new_url,headers=headers).text tree = etree.HTML(page_text) a_list = tree.xpath(’//div[@id='container']/div/p/a’) for a in a_list: a_src = a.xpath(’./@href’)[0] a_title = a.xpath(’./text()’)[0] a_title = a_title.encode(’iso-8859-1’).decode(’utf-8’) # 爬取下载页面 page_text = requests.get(url=a_src,headers=headers).text tree = etree.HTML(page_text) dl_src = tree.xpath(’//div[@id='down']/div[2]/ul/li[8]/a/@href’)[0]resume_data = requests.get(url=dl_src,headers=headers).content resume_name = a_title resume_path = dirName + ’/’ + resume_name + ’.rar’ with open(resume_path,’wb’) as fp: fp.write(resume_data) print(resume_name,’下载成功!’)

以上就是python 爬取免费简历模板网站的示例的详细内容，更多关于python 爬取网站的资料请关注好吧啦网其它相关文章！

Python 编程

上一条：Python日志器使用方法及原理解析下一条：python如何提升爬虫效率

相关文章：

1. .Net Core和RabbitMQ限制循环消费的方法2. vue移动端弹起蒙层滑动禁止底部滑动操作3. Vue批量更新dom的实现步骤4. 浅谈SpringMVC jsp前台获取参数的方式 EL表达式5. ThinkPHP5 通过ajax插入图片并实时显示(完整代码)6. ASP 信息提示函数并作返回或者转向7. AJAX实现数据的增删改查操作详解【java后台】8. 《CSS3实战》笔记--渐变设计（三)9. Java8中List转Map(Collectors.toMap) 的技巧分享10. JAVA代码实现MongoDB动态条件之分页查询

排行榜

					
					Sun发布下一代Java手机开发平台- 与Orange合作
IntelliJ IDEA配置Tomcat服务器的方法
IntelliJ IDEA导入项目的方法
Java8中List转Map(Collectors.toMap) 的技巧分享
浅谈SpringMVC jsp前台获取参数的方式 EL表达式
Spring Boot ActiveMQ如何设置访问密码
Vue批量更新dom的实现步骤
vue移动端弹起蒙层滑动禁止底部滑动操作
《CSS3实战》笔记--渐变设计（三)
.Net Core和RabbitMQ限制循环消费的方法
ThinkPHP5 通过ajax插入图片并实时显示(完整代码)
				

热门标签