python2.7 ocr 文本识别应该怎么弄

2023-02-19 23:59:02Python022

python2.7 ocr 文本识别应该怎么弄,第1张

Python图片文本识别使用的工具是PIL和pytesser。因为他们使用到很多的python库文件，为了避免一个个工具的安装，建议使用pythonxy

pytesser是OCR开源项目的一个模块，在Python中导入这个模块即可将图片中的文字转换成文本。pytesser调用了tesseract。当在Python中调用pytesser模块时，pytesser又用tesseract识别图片中的文字。pytesser的使用步骤如下：

首先，安装Python2.7版本，这个版本比较稳定，建议使用这个版本。

其次，安装pythoncv。

然后，安装PIL工具，pytesser的使用需要PIL库的支持。

接着下载pytesser

最后，将pytesser解压，这个是免安装的，可以将解压后的文件cut到Python安装目录的Lib\site-packages下直接使用，比如我的安装目录是：C:\Python27\Lib\site-packages，同时把这个目录添加到环境变量之中。

完成以上步骤之后，就可以编写图片文本识别的Python脚本了。参考脚本如下：

from pytesser import *

import ImageEnhance

image = Image.open('D:\\workspace\\python\\5.png')

#使用ImageEnhance可以增强图片的识别率

enhancer = ImageEnhance.Contrast(image)

image_enhancer = enhancer.enhance(4)

print image_to_string(image_enhancer)

tesseract是谷歌的一个对图片进行识别的开源框架，免费使用，现在已经支持中文，而且识别率非常高，这里简要来个helloworld级别的认识

下载之后进行安装，不再演示。

在tesseract目录下，有个tesseract.exe文件，主要调用这个执行文件，用cmd运行到这个目录下，在这个目录下同时放置一张需要识别的图片，这里是123.jpg

然后运行:tesseract 123.jpg result

会把123.jpg自动识别并转换为txt文件到result.txt

但是此时中文识别不好

然后找到tessdata目录，把eng.traineddata替换为chi_sim.traineddata,并且把chi_sim.traineddata重命名为eng.traineddata

ok,现在中文识别基本达到90%以上了

推荐使用现有的ocr库，没必要自己造轮子。现有的有三个库都可以用来识别，也都是基于Tesseract的一个封装。

pyocr：Tesseract 和 Cuneiform 的一个封装(wrapper)。

pytesseract：Google Tesseract OCR 的另一个封装(wrapper)。

python-tesseract - Google Tesseract OCR 的一个包装类。

图片文本识别率文件中文

# 上一篇：java中怎样给按钮设置快捷键？

# 下一篇：js如何动态添加数组？

给您推荐相同类型的内容：

css中设置html的外部样式表的奇偶行交替色类似
可以啊，用css3或者jq实现。可以使用css3的奇偶选择器，如：tr:nth-child(odd){background-color:#FFE4C4}tr:nth-child(even){background-color:#F0F0F
android开发电脑配置要求2022
1、首先android开发电脑配置要求，安卓8。0或更高的系统支持。2、其次CPU架构: 要求ARM 64位。3、最后性能要求: 支持Neon 1。5GB内存以上(安装包体) 。开发安卓app必须用windows系统的电脑吗？这到不必的
笔记本电脑怎么录像？
笔记本电脑录像：一、先准备工具，自带摄像头就算了，没有的话就去买个外接的摄像头。二、接着去百度搜索下载一个摄像头软件，比如摄像头录像大师。三、点击开始摄就ok了。1、笔记本电脑是一种小型、可携带的个人电脑，通常重1-3公斤。其发展趋势是体
css3动画使用
animation实现动画由俩个部分组成，通过类似flash动画的关键帧来申明一个动画，在animation属性中调用关键帧声明的动画实现一个更为复杂的动画效果关键帧例如：调用关键帧：语法 animation:anima
玩守望先锋要什么配置
问题一：玩守望先锋游戏电脑需要什么配置要求CPU――处理器 cpu的要求是“Core i3”，也就是说“i3 530”就能满足“守望先锋”对CPU的需求了。具体见下图，红线及其以上的cpu型号――均能满足最低要求。显卡
Python 简单的扩音，音频去噪，静音剪切
数字信号是通过对连续的模拟信号采样得到的离散的函数。它可以简单看作一个以时间为下标的数组。比如，x[n]，n为整数。比如下图是一个正弦信号(n=0,1, ..., 9)：对于任何的音频文件，实际上都是用这种存储方式，比如，下面是对应英
CSS鼠标经过图片变亮,移开变变暗效果代码怎么写
1、打开hbuilder，在空白的html文件上面设置一个div，给div一个class并命名为img：2、在css里设置img的类一定的宽和高，引入示例图片，设置图片为不重复。并且给img的类设置“:hover”伪类，设置伪类内的透明度为
开发微信小程序需要学习什么编程语言？
微信小程序开发一般有php语言和java语言两种语言、htmlcssjs三件套都要会。微信小程序常见使用“MINA”框架，这个框架为微信小程序的运行提供了丰富的组件和API。微信小程序开发者要学会和掌握小程序的框架结构、数据绑定机制、模
VB6.0，VB.net和易语言那个较好？
论强大，肯定是.net，易语言中很多操作实现不了。个人感觉易语言就象是关键字汉化的VB，包括在易语言的帮助说明中，都有英文语句，而这些英文语句，很象是VB的语法。.net的功能要更强大。开始会有些不适应，用惯了以后，会感觉到，比VB方便多了
ruby中怎么判断一个是否是数字，如果是数字就继续，如果是字符就停止
查询核心模块KernelAPI可知：如果是Float类型则通过Kernel.Float(字符串)判断，这里不能转为浮点数则会抛出异常。你只需再捕获一下输出自己的信息就行。方法很多。比如，可以用isinstance函数或type函数。例子
go语言可以做什么
1、服务器编程：以前你如果使用C或者C++做的那些事情，用Go来做很合适，例如处理日志、数据打包、虚拟机处理、文件系统等。2、分布式系统、数据库代理器、中间件：例如Etcd。3、网络编程：这一块目前应用最广，包括Web应用、API应用、
json字符串怎么转换为java对象？
可以使用jackson的 new ObjectMapper().readValue(String, bean.class)x0dx0a或者使用 JSONObject.toBean(String,bean.class)x0dx0a都可
C语言怎么处理图片
首先现在图片取模软件找到软件快捷方式，点击打开软件现在进入到了取模软件，点击“载入图片”，现在就可以进行添加图片了选择需要添加的图片，点击选择图片，然后单击“打开”现在点击“设置”进入图片参数设置现在有输出格式，取模方式，图片截取范围一些参
电脑怎么复制粘贴
电脑复制粘贴的方法一共有三种，步骤如下：方法一：按住鼠标左键，选择所需复制的文字，接着点击鼠标右键，选择“复制”，再点击右键选择“粘贴”即可方法二：按住鼠标左键，选择所需复制的文字，按下ctrl+C进行复制按下ctrl+V进行粘贴
丧波为什么敢杀太子
因为太子提出要阿祥的女人陪他,三人协议达成,太子和ruby上了车走了,车子来到半路,太子因ruby被激怒,打算下电话亭打电话,后面丧波就在电话亭等着太子,最后太子惨死。《龙在江湖》是由香港永盛电影公司发行的动作片，由王晶执导，刘德华、梁
WORD中目录老是不能更新是怎么回事，
1、首先，打开需要做目录的文章，接着选择“视图—文档视图—大纲视图” ，如图所示。2、然后，将鼠标放在标题或段落中的任何地方，选择标题等级，根据你要做目录的显示级别，每一个标题都选择一个等级，如图所示。3、关闭大纲视图，将鼠标放在需要做目
js如何动态添加数组？
js动态添加数组可以按下面的步骤:1、在数组的开头添加新元素 - unshift()源代码:&lt!DOCTYPE html&gt&lthtml&gt&ltbody&gt&
安卓手机怎么设置GO输入法中文手写国际版
安装GO输入法，然后进入手机系统设置，进入语言和键盘,在GO输入法那里打钩，然后在你要输入文字的时候，长按对话框，屏幕会出现粘贴，复制，输入法等等，点输入法那里，选择GO输入法，就好了，望采纳Go语言也称 Golang，兼具效率、性能、安全
C语言中int是什么意思？
int表示整型变量，是一种数据类型，用于定义一个整型变量，在不同编译环境有不同的大小，不同编译运行环境大小不同。整型变量包括下面几种类型：1、有符号基本整型，关键字：［signed] int，数值范围：－2 147 483 648 ~ 2
.NET开发是什么？需要用到哪些开发语言？
.NET是微软基于Windows研发的一种开发平台，而.NET开发就是针对Windows平台进行的开发，.NET开发可以用C#语言，VB语言进行开发。.NET平台是基于Windows的开发平台我们平时用的电脑都是装的Windows系统，而.
为什么要使用 Go 语言?Go 语言的优势在哪里?
1、简单易学。Go语言的作者本身就很懂C语言，所以同样Go语言也会有C语言的基因，所以对于程序员来说，Go语言天生就会让人很熟悉，容易上手。2、并发性好。Go语言天生支持并发，可以充分利用多核，轻松地使用并发。这是Go语言最大的特点
GO语言如何编译发布到Linux
在命令行执行如下指令 SET CGO_ENABLED=0 SET GOOS=linux SET GOARCH=amd64 go build main.go 开始编译程序1、解压压缩包到go工作目录，如解压到E:ope
C语言中怎样换行？
1 使用字符串，输出在一个字符串结尾加上“rn”，如“hellorn”2 使用字符数组拼接成字符串（在嵌入式c的使用中是常见的），在数组末尾增加0x0d和0x0a如：unsigned char data[8] data[0]
go语言适合做什么
Go语言主要用作服务器端开发。其定位是用来开发“大型软件”的，适合于需要很多程序员一起开发，并且开发周期较长的大型软件和支持云计算的网络服务。Go语言融合了传统编译型语言的高效性和脚本语言的易用性和富于表达性，不仅提高了项目的开发速度，而
JS里面怎么获取当天日期
1.首先，下载谷歌浏览器，2.下载完成后打开谷歌浏览器，然后按【F12】打开谷歌浏览器控制台(在浏览器方)，然后点击【Console】切换到调试窗口3.然后开始输入代码，首先定义一个变量名字为test，代码如下：var test =n
如何实现支持数亿用户的长连消息系统
此文是根据周洋在【高可用架构群】中的分享内容整理而成，转发请注明出处。周洋，360手机助手技术经理及架构师，负责360长连接消息系统，360手机助手架构的开发与维护。不知道咱们群名什么时候改为“Python高可用架构群”了，所以不得不说，很
555上ruby什么意思
你问的应该是ruby什么意思？是传说宝石。ruby的意思：n，红宝石，深红色，adj，红宝石的。传说红宝石是上帝在创造万物时所创造的十二种宝石中最为贵重的，按上帝的旨意这一宝石中的贵族被置于亚伦的颈上。泰国是红宝石的产地和红宝石的进出口的贸
muckruby有什么用
ruby是红宝石的意思。Muck是一款roguelike生存冒险游戏。红宝石的作用是：用来给雷文德斯境内依靠心能运行的神完和装置供能。由于心能枯竭，各色泥仆开始拿它们交易物品；红宝石是挖矿的专业技能有几率挖到，挖矿是挖铁以上的都可能出打怪是
2022科目一考试是什么样的计算机
普通的计算机就是普通的电脑,没有键盘,一个显示器一个鼠标。科目一电脑考试流程如下：个人信息录入，在这一栏里输入你的姓名，开始考试之前会有工作人员让你刷指纹进行身份确认。听从工作人员安排依次排队开始资料审核及指纹采集。先用右手拇指轻轻压在指纹
js如何调用c语言写的api
包含api的.h文件，然后直接调用就可以了，比如winsock.h，可以调用recv等函数，也可以在函数前面加::答案补充HWND hWnd = ::FindWindow(sClassName, sWindowName)传入类明到sCl

推荐阅读

热门文章

最新发布

标签列表

python2.7 ocr 文本识别 应该怎么弄

给您推荐相同类型的内容：

python2.7 ocr 文本识别应该怎么弄