文章详情页

解决python存数据库速度太慢的问题

浏览：43日期：2022-06-23 10:40:39

问题

在项目中遇到一个问题，需要从文本中读取三万条数据写入mysql数据库，文件中为用@分割的sql语句，但是在读取的过程中发现速度过慢，三万八千条数据需要220秒，问题代码片段如下：

def read_to_mysql(filecata, targetDir): ’’’ 用来写入数据库，写入后会剪贴掉文件 filecata 为保存有文件地址的list，已去掉尾部的空格 :param filecata: 文件目录 :param targetDir: 要复制的目标目录 :return: ’’’ root_dir = os.path.abspath(os.path.join(os.getcwd(), './')) config = configparser.ConfigParser() config.read(root_dir + '/config.ini') __host = config.get('DatabaseOfWRT', 'host') __database_name = config.get('DatabaseOfWRT', 'database') __user_name = config.get('DatabaseOfWRT', 'username') __user_passwaord = config.get('DatabaseOfWRT', 'password') __charset = config.get('DatabaseOfWRT', 'charset') conn = pymysql.connect( host=__host, user=__user_name, password=__user_passwaord, database=__database_name, charset=__charset ) cursor = conn.cursor() with open(filecata, 'r', encoding=’utf-8’) as f: data = f.read() # 读取文件 data_list = data.split(’@’) del data_list[-1] starttime = int(time.time()) for data_str in data_list: data_str = str(data_str) sql = data_str + ’;’ cursor.execute(sql) conn.commit() print(flag) copy_del_file(filecata, targetDir) # 用来剪切的函数，此处不影响，因而省略 cursor.close() conn.close()解决方案

经测试发现，影响速度的主要原因是commit(),因为没过几秒提交一次即可，但是因为提交的字符长度有限制，所以要设置一个合理的时间读取，代码修改如下：

def read_to_mysql(filecata, targetDir): ’’’ 用来写入数据库，写入后会剪贴掉文件 filecata 为保存有文件地址的list，已去掉尾部的空格 :param filecata: :param targetDir: 要复制的目标目录 :return: ’’’ root_dir = os.path.abspath(os.path.join(os.getcwd(), './')) config = configparser.ConfigParser() config.read(root_dir + '/config.ini') __host = config.get('DatabaseOfWRT', 'host') __database_name = config.get('DatabaseOfWRT', 'database') __user_name = config.get('DatabaseOfWRT', 'username') __user_passwaord = config.get('DatabaseOfWRT', 'password') __charset = config.get('DatabaseOfWRT', 'charset') conn = pymysql.connect( host=__host, user=__user_name, password=__user_passwaord, database=__database_name, charset=__charset ) cursor = conn.cursor() with open(filecata, 'r', encoding=’utf-8’) as f: data = f.read() # 读取文件 data_list = data.split(’@’) del data_list[-1] starttime = int(time.time()) for data_str in data_list: endtime = int(time.time()) data_str = str(data_str) sql = data_str + ’;’ cursor.execute(sql) if endtime - starttime ==10: # 每过十秒提交一次 starttime = int(time.time()) conn.commit() conn.commit() copy_del_file(filecata, targetDir) cursor.close() conn.close() return flag

此时写入三万八千条数据需要9秒

补充：python 连数据库cursur.fetchall ()速度慢的解决方案

解决游标遍历慢的方法：

一行一行去遍历，而不是一下全部读取出来

将cursur.fetchall()更改为for i in cursur:

补充：python 读取文件时速度的问题

'''举例读取文件'''# 第一种方式with open(’test.txt’, ’r’, encoding=’utf-8’) as f: info = f.readlines() for line in info: pass# 第二种方式with open(’test.txt’, ’r’, encoding=’utf-8’) as f: for line in f: pass

对于以上两种方式读取文件，各自有各自的用途，当用两种方式都可以时，第二种方式的效率是第一种的几个量级， readlines()将文件内容读取到内存的list中，操作虽然方便，但是消耗内存，运行效率慢。

原生的f是将文件内容读到生成器中，当需要操作时，从生成器中循环出来，速度很快，操作大文件时建议用第二种方式！

以上为个人经验，希望能给大家一个参考，也希望大家多多支持好吧啦网。如有错误或未考虑完全的地方，望不吝赐教。

Python 编程

上一条：python实现高效的遗传算法下一条：python pyecharts库的用法大全

相关文章：

1. Java Long类型对比分析2. ASP.NET MVC使用typeahead.js实现输入智能提示功能3. Eclipse新建项目不可选择Java Project问题解决方案4. python使用pynput库操作、监控你的鼠标和键盘5. Ajax校验用户名是否存在的方法6. Spring Module 0.3 版本发布7. spring MVC实践需要注意的地方8. python中HTMLParser模块知识点总结9. python中return如何写10. java实现邮件发送

排行榜

					
					python中return如何写
python使用pynput库操作、监控你的鼠标和键盘
Java Long类型对比分析
java实现邮件发送
Eclipse新建项目不可选择Java Project问题解决方案
ASP.NET MVC使用typeahead.js实现输入智能提示功能
Ajax校验用户名是否存在的方法
IntelliJ IDEA配置Tomcat服务器的方法
Spring Module 0.3 版本发布
IntelliJ IDEA导入项目的方法
IntelliJ IDEA设置编码格式的方法
				

热门标签