如何利用Python对PDF文件做OCR识别

2023-02-26 05:41:02Python035

如何利用Python对PDF文件做OCR识别,第1张

1.安装tesseract

2.安装PyOCR

3.安装Wand和PIL

在我们开始之前，还需要另外安装两个依赖包。一个是Wand。它是Imagemagick的Python接口。

我们需要使用它来将PDF文件转换成图像：

我们也需要PIL因为PyOCR需要使用它。你可以查看官方文档以确定如何将PIL安装到你的操作系统中。

5.开始

现在我们需要获得OCR库（在本例中，即tesseract）的句柄以及我们在PyOCR中将使用的语言：

我们使用tool.get_available_languages里的第二种语言，因为之前我曾尝试过，第二种语言就是英语。

接着，我们需要建立两个列表，用于存储我们的图像和最终的文本。

下一步，我们需要采用wand将一个PDF文件转成jpeg文件。让我们试一试吧！

注意：将PDF_FILE_NAME替换成当前路径下的一个可用的PDF文件名。

wand已经将PDF中所有的独立页面都转成了独立的二进制图像对象。我们可以遍历这个大对象，并把它们加入到req_image序列中去。

现在，我们仅仅需要在图像对象上运行OCR即可，非常简单：

现在，所有识别出的文本已经加到了final_text序列中了。你可以任意地使用它。以上就是利用Python对PDF文件做OCR识别的全部内容，希望这个教程能够帮助到你们！

可以用捷速ocr文字识别软件，使用教程：

第一步，我们需要下载捷速OCR文字识别软件，我们可以去官网或者在各大下载网站找到下载。运行软件，选择界面中的“从图片读文件”。或者关掉对话框，直接点击左上角的“读取”也是一样的。

第二步，在出现的查找框里选择需要转换的图片，然后软件界面就会出现该图片的具体情况了。

第三步，我们点击工具栏中的“识别”按钮，就能对图片进行识别了，识别的结果会呈现在图片右边。我们可以进行校对，然后修改错误。

第四步，最后我们工具栏中的“Word”，就会直接输出一个Word文档供我们使用了。或者你也可以直接复制识别结果，也可以达到一样的效果。

我们可以文件图片就会软件

# 上一篇：C语言如何使用print语句

# 下一篇：C语言绘直方图

给您推荐相同类型的内容：

c语言画坦克的程序，带注释
另一个分隔符是注释符号对（* *），它继承自C语言。这种注释以*开始，以*结尾。编译器把*和*之间的部分都作为注释来处理　注释符号对可以放置在允许输入tab、空格或新行的任何地方。注释符号对可以跨越程序的多个行，但是不是必须这样
python闭包问题
def count(): fs = [] for i in range(1, 4): def f(j): def g(): return j * j
技术问题之C语言近程型和远程型的区别是什么
近程就是near，远程就是far主要早期16位cpu上的dos系统，内存地址是20位的，但寄存器是16位的这样一个16位的指针，也就是near指针，能访问的内存范围只有64K，但20位的内存地址，实际允许定义大于64K的数据，这样，一个指针
ruby怎么在字符串中查找特定字符
"abcdefghijklmnopqrstuvwxyz".slice(9, 6)找第10个字符开始的6个字符也就是第10到第15个索引从0开始所以是9, 6当然因为这是 ruby 所以我们还可以这么写&quo
C语言中内存分布及程序运行加载过程
一个程序内存分配：下图是APUE中的一个典型C内存空间分布图（虚拟内存）例如： int g1=0, g2=0, g3=0 int max(int i) { int m1=0,m2,m3=0, p_max s
为什么许多原本的 Java 项目都试图用 go 进行重写开源？
项目推倒重构是项目开发大忌，一方面我们要尽量避免做项目推倒重构，尽量在前期就规划好，另一方面，我们又希望项目能常做小重构，这对项目可持续性开发是很有帮助的。而语言的重构，把Java项目用Go语言重写一遍，无疑是一次重大的推倒重来。一、Go语
图像匹配方法有哪些
图像匹配的方法很多，一般分为两大类，一类是基于灰度匹配的方法，另一类是基于特征匹配的方法。（1）基于灰度匹配的方法。也称作相关匹配算法，用空间二维滑动模板进行图像匹配，不同算法的区别主要体现在模板及相关准则的选择方面。（2）基于特征匹配的方
ruby头盔每个有什么区别
有些是防水性能强的，有些是适合越野的，有些是全季节通用的，具体买哪一种看你自己的选择，Jeromecoste(杰罗姆考斯特)受到SteveMcqueen（史蒂夫麦奎因），科幻小说还有法国奢侈品的优良传统的影响，由此创造了Ruby品牌。它不但
Python 中如何结束子线程
等待串口数据导致线程自己sleep而没有机会执行，主线程的join没法继续，方法就是这样的，换成这个能执行from threading import *import timeclass MyThread(Thread):def run
python 循环中嵌套循环循环次数不固定
是不固定的。Python不仅支持if语句相互嵌套，while和for循环结构也支持嵌套。所谓嵌套（Nest），就是一条语句里面还有另一条语句，例如for里面还有forwhile里面还有while，甚至while中for或者for中有whil
C语言怎么编写开头和结尾？
C语言中，通常以#include&ltstdio.h&gt开头，以return 0结束。下面给出具体解释。#开头的是预处理指令，不是C语句的一部分，以#开头的语句，在预处理阶段，由预处理器处理，例如：#include &a
《Go语言学习笔记》epub下载在线阅读全文，求百度网盘云资源
《Go语言学习笔记》（雨痕）电子书网盘下载免费在线阅读链接：https:pan.baidu.coms1-RaUFt31edzl-SvPzMxA0Q提取码：qyzq 书名：Go语言学习笔记豆瓣评分：8.1作者: 雨痕出版社:
利用go语言实现求数组交集的算法
题目: 给定两个数组，编写一个函数来计算它们的交集.(来自 leecode(349))示例 1：输入：nums1 = [1,2,2,1], nums2 = [2,2] 输出：[2] 示例 2：输
c语言背包问题
算法分析：使用贪心策略求解此类问题时，首先要选出最优的度量标准。可供选择的度量标准有三种：价值，容量，单位价值（vw，价值重量）。显然，价值高的物品容量可能太大，容量大的物品价值也可能很低。最优的度量标准是单位价值。背包问题算法思路：1
英语音变
基本知识一：音变备注： 1.字母的音变又称字母的通转，是原始印欧语根在梵语，原始日耳曼语，希腊语，拉丁语，意大利语，法语，西班牙语，英语等诸多子语言中发生的一种元音字母和辅音字母通转的语言现象，简言之，就是在拼写上虽然
golang适合做web开发吗
适合。框架足够成熟了 A Survey of 5 Go Web Frameworks小型项目你甚至不用框架，用nethttp http - The Go Programming Language常用库也成熟了 Top - Go Searc
使用Go 语言开发大型 MMORPG 游戏伺服器怎么样
使用Go 语言开发大型 MMORPG 游戏伺服器怎么样如果是大型网路游戏的话，我觉得是不合适的。现阶段go语言的执行效率还是太低了。在底层编译器的优化方面做得和c++相比还是差了不少。go语言也是比较适合快速开发的专案比较合适从
墨尔本的东北女网红叫什么
墨尔本的东北女网红叫RubyHill。这个女生名叫RubyHill，来自墨尔本东北区的YarraValley，今年只有19岁，澳洲第一大网红抖音账号“微悉尼”，带你看遍澳洲生活那些有趣的事儿，留学旅游移民必备。请在抖音号搜索“微悉尼”，我们
python结束程序的语句
sys.exit()Python中，当有时当一个条件成立的情况下，需要终止程序，可以使用sys.exit()退出程序。sys.exit()会引发一个异常。1.如果这个异常没有被捕获，那么python编译器将会退出，后面的程序将不会执行。2.
GO语言的printf为什么会覆盖
这个就是C语言本身的功能啊C的函数名,在程序中都是代表函数的地址,main是主函数,它就是一个地址而%x表示十六进制输出内容(你用%d或%p也都是可以的,特别是%p,就是用来输出地址的)本文主要介绍了Go语言中文件读写的相关操作。文件
Go语言使用 map 时尽量不要在 big map 中保存指针
不知道你有没有听过这么一句：在使用 map 时尽量不要在 big map 中保存指针。好吧，你现在已经听过了：）为什么呢？原因在于 Go 语言的垃圾回收器会扫描标记 map 中的所有元素，GC 开销相当大，直接GG。这两天在《Mas
黄皮素颜也可以涂的口红
黄皮素颜也可以涂的口红黄皮素颜也可以涂的口红，对于注重自己的美貌的人来说，都是希望自己能够容颜不老，十分的注重自身的皮肤状况，要时刻保持自己的美丽，特别是口红的色号。以下分享黄皮素颜也可以涂的口红？黄皮素颜也可以涂的口红1
微信如何发起投票功能
微信投票发起的方法如下：工具／原料：华为P30、EMUI9.1、微信8.0.25步骤：1、打开微信，进入“发现”页面，点击【小程序】。2、点击右上角搜索图标。3、在搜索框内输入“腾讯投票”，然后点击“搜索”。4、点击“单选投票”或者“
这个是哪部动漫？
RWBY （美国原创网络动画）编辑《RWBY》（发音同Ruby）是一部在2013年7月首播的原创网络动画。R、W、B、Y 分别是英语红白黑黄的首字母，代表的分别是四位女主角的主题色。该作由美国Rooster Teeth Productio
聊聊python的分位数
在日常的数据分析中，分位数是非常重要的一环，在探查数据分布，定义指标中都必不可缺。但 python 里的分位数计算却潜藏了一些坑点，特分享。我们先看看百度百科的分位数定义：正如上文所言，四分位数就是将数据从小到大排成4等
Ruby Rose的个人经历
鲁比·洛斯 (Ruby Rose) 全名Ruby Rose Langenheim，是澳大利亚MTV音乐电视台主持人、电台DJ、模特，更是少数公开出柜的明星之一。鲁比·洛斯 (Ruby Rose) 是那种可以冷艳性感也可以中性帅气的美女，她的
c语言 1个字节范围为什么是 -128 — 127，-128怎么算的
正数一个字节最大只能是127,128超过了一个字节能表示的最大值，127是01111111，加1, 00000001等于10000000，最高为是2的7次方等于128，由于一个字节的最大值是127，所以128就只能是-128，但是这里的
C语言绘直方图
#include &ltmath.h&gt#include &ltconio.h&gt#include &ltstdio.h&gt#include &ltstdlib.h&gt
最近我在学习Ruby语言，请问各位哪里有相关的教程书籍和相关的编辑工具？
http:book.douban.comdoulist67419?vote=N&ampck=None这个是ror学习的一些书籍其中Programming Ruby中文版(第2版)对学习ruby语言是不错的编辑工具
C语言里，v是什么意思？
v是垂直制表符，即vertical tabulation的缩写。它的作用是让v后面的字符从下一行开始输出，且开始的列数为v前一个字符所在列后面一列，也就是相当于将活跃位置挪动到右下方的位置。自定义函数，如果函数不需要返回值给主函数，

推荐阅读

热门文章

最新发布

标签列表

如何利用Python对PDF文件做OCR识别

给您推荐相同类型的内容：