文章详情页

python使用多线程备份数据库的步骤

浏览：58日期：2022-06-18 08:50:20

目录一、为什么要用线程池二、线程池练习演示例子1:使用submit方法演示例子2:使用map方法三、线上数据库测试总结:一、为什么要用线程池

1.多线程比单线程运行要快很多，比如在我工作中，每台服务器至少8个库以上，用单线程备份太慢了。

2.不是越多线程就会越好，而是根据服务器的资源来合理定义worker线程，否则会造成服务器严重负载，影响到线上业务。

3.备份数据库都是消耗IO操作，用多线程比多进程稍微会更有优势。

从Python3.2开始，标准库为我们提供了 concurrent.futures 模块，它提供了 ThreadPoolExecutor (线程池)和ProcessPoolExecutor (进程池)两个类。相比 threading 等模块，该模块通过 submit 返回的是一个 future 对象，它是一个未来可期的对象，通过它可以获悉线程的状态主线程(或进程)中可以获取某一个线程(进程)执行的状态或者某一个任务执行的状态及返回值：主线程可以获取某一个线程（或者任务的）的状态，以及返回值。当一个线程完成的时候，主线程能够立即知道。让多线程和多进程的编码接口一致。

二、线程池练习演示例子1:使用submit方法

from concurrent.futures import ThreadPoolExecutorimport time def test_thread(sec): time.sleep(sec) print(f'sleep {sec} done') return sec with ThreadPoolExecutor(max_workers=4) as t: # 创建一个最大容纳数量为4的线程池 task1 = t.submit(test_thread, 1) task2 = t.submit(test_thread, 2) # 通过submit提交执行的函数到线程池中 task3 = t.submit(test_thread, 3) print(f'task1: {task1.done()}') # 通过done来判断线程是否完成 print(f'task2: {task2.done()}') print(f'task3: {task3.done()}') time.sleep(2.5) print(f'task1: {task1.done()}') print(f'task2: {task2.done()}') print(f'task3: {task3.done()}') print(task1.result()) # 通过result来获取返回值

结果输出:

task1: Falsetask2: Falsetask3: Falsesleep 1 donesleep 2 donetask1: Truetask2: Truetask3: False1sleep 3 done

使用 with 语句，通过 ThreadPoolExecutor 构造实例，同时传入 max_workers 参数来设置线程池中最多能同时运行的线程数目。使用 submit 函数来提交线程需要执行的任务到线程池中，并返回该任务的句柄（类似于文件、画图），注意 submit() 不是阻塞的，而是立即返回。通过使用 done() 方法判断该任务是否结束。上面的例子可以看出，提交任务后立即判断任务状态，显示3个任务都未完成。在延时2.5后，task1 和 task2 执行完毕，task3 仍在执行中。

演示例子2:使用map方法

import timefrom concurrent.futures import ThreadPoolExecutor def spider(page): time.sleep(page) return page start = time.time()executor = ThreadPoolExecutor(max_workers=4) i = 1for result in executor.map(spider, [2, 3, 1, 4]): print('task{}:{}'.format(i, result)) i += 1

结果输出:

task1:2task2:3task3:1task4:4

from concurrent.futures import ThreadPoolExecutor有两种方式，一种是submit()函数，另一种是map()函数，两者的主要区别在于：1.map可以保证输出的顺序, submit输出的顺序是乱的2.如果你要提交的任务的函数是一样的，就可以简化成map。但是假如提交的任务函数是不一样的，或者执行的过程之可能出现异常（使用map执行过程中发现问题会直接抛出错误）就要用到submit()3.submit和map的参数是不同的，submit每次都需要提交一个目标函数和对应的参数，map只需要提交一次目标函数，目标函数的参数放在一个迭代器（列表，字典）里就可以。

三、线上数据库测试

环境:centos6，数据库版本5.7，数据备份2个1.7G、一个800M、一个200M

第一种:shell脚本for的方式备份4个数据库

#!/bin/bashbackup_path='/data/backup/'myuser='root'mypwd='123456'db_name='test_1000'current_time=$(date +%Y%m%d%H%M%S)for i in $(seq 4);do /usr/local/mysql/bin/mysqldump -u${myuser} -p${mypwd} --single-transaction --master-data=2 --set-gtid-purged=off '${db_name}${i}' | gzip > ${backup_path}/'${db_name}${i}'_${current_time}.sql.gzdone

查看执行时间

mysqldump: [Warning] Using a password on the command line interface can be insecure.mysqldump: [Warning] Using a password on the command line interface can be insecure.mysqldump: [Warning] Using a password on the command line interface can be insecure.mysqldump: [Warning] Using a password on the command line interface can be insecure. real 4m28.421suser 3m50.360ssys 0m5.962s

第二种方式:多线程备份

python使用多线程备份数据库的步骤

可以明显看到优势

总结:

在服务器上有需要备份多个数据库时，使用python多线程的方式比传统的shell脚本循环备份会更有优势，可以充分利用服务器上的资源，有效提升效率。

以上就是python使用多线程备份数据库的步骤的详细内容，更多关于python 多线程备份数据库的资料请关注好吧啦网其它相关文章！

Python 编程

上一条：Python开发加薪利器之Docker的使用实践下一条：Python实现简单2048小游戏

相关文章：

1. JSP之表单提交get和post的区别详解及实例2. CSS Hack大全-教你如何区分出IE6-IE10、FireFox、Chrome、Opera3. WMLScript的语法基础4. HTML5 Canvas绘制图形从入门到精通5. 轻松学习XML教程6. asp读取xml文件和记数7. 利用CSS制作3D动画8. 怎样才能用js生成xmldom对象，并且在firefox中也实现xml数据岛？9. asp中response.write("中文")或者js中文乱码问题10. 读大数据量的XML文件的读取问题

排行榜

					
					永久解决idea git log乱码的问题
使用Docker的NFS-Ganesha镜像搭建nfs服务器的详细过程
深入浅析springboot中static和templates区别
JavaScript canvas实现俄罗斯方块游戏
Javascript实现单选框效果
vue 修改 data 数据问题并实时显示操作
intellij idea使用git stash暂存一次提交的操作
Django 后台带有字典的列表数据与页面js交互实例
利用CSS制作3D动画
JSP之表单提交get和post的区别详解及实例
jsp cookie+session实现简易自动登录
				

热门标签