图片处理 - python PIL 图片放大的问题
问题描述
尝试用pytesseract来识别一些图片:
原始图片尺寸较小,用pytesseract无法识别,开始尝试用 Mac 自带的预览工具来放大尺寸 ,发现可以正常识别了,然后尝试用 PIL 来放大图片,代码如下:
images.resize((1985, 336),Image.ANTIALIAS).save(’/images’, quality=95,dpi=(72, 72))
问题是,通过 PIL 放大的图片不能被pytesseract 正常识别,我对比了两张图片的信息,如下图:
发现除了图片尺寸不同外,其他信息都是相同的,但是就是无法被pytesseract正常识别,所以求教如何用 PIL 放大出可以正常被pytesseract识别的图片(其他工具也可以)
问题解答
回答1:你可以尝试改变tesseract的-psm参数:
image = Image.open(’ocr.png’)image.show()for p in range(4,14): print(p, ’-’, pytesseract.image_to_string(image, config='-psm {}'.format(p)))
输出如下:
4 - 3 4’1 4’1 I] I]5 - DDd.d._...I._6 - 3 4’1 4’1 I] I]7 - 3 4’1 4’1 I] I]8 - 344009 - 3440010 - W11 - 3£1I1I]I]12 - 13 - 34400
如果图片只有数字你也能尝试用tessedit_char_whitelist:
pytesseract.image_to_string(image, config='-psm 8 -c tessedit_char_whitelist=1234567890')
相关文章:
1. javascript - 一排三个框,各个框的间距是15px,距离外面的白框间距也是15px,这个css怎么写?2. javascript - jQuery post()方法,里面的请求串可以转换为GBK编码么?可以的话怎样转换?3. html5 - vue-cli 装好了 新建项目的好了,找不到项目是怎么回事?4. django - python 2层文件夹导入5. python - 用urllib抓取网页上的下载链接,目标文件是xls形式,但发现抓下来的xls是空表,里面只有一句报错信息,求帮助。6. 用CSS3 box-sizing 属性实现两个并排的容器,如果想让容器中间有间隔该如何实现7. mysql - C#连接数据库时一直这一句出问题int i = cmd.ExecuteNonQuery();8. css - ul ol前边的标记如何调整样式呢9. javascript - vue 手机端项目在进入主页后 在进入子页面,直接按返回出现空白情况10. python3.x - python 中的maketrans在utf-8文件中该怎么使用

网公网安备