安装百度飞桨OCR库

2023-04-30 14:45:01Python030

安装百度飞桨OCR库,第1张

在安装部署过程中，github上的部署流程太简略了，越高越迷糊，这两篇文章帮了大忙。

https://blog.csdn.net/CHYabc123456hh/article/details/107830505

https://blog.csdn.net/CHYabc123456hh/article/details/107844769

先安装docker，拉取镜像，启动docker，配置好环境，照着文档安装好模块就可以使用了。

中间犯了个低级错误，在uninstall时，把deploy/hubserving/ 路径也给带上了，导致其实没有uninstall成功，再次安装时就报version 变量未定义，因此还看了install、uninstall的源码，绕了一大圈，浪费了很多时间。

推荐使用现有的ocr库，没必要自己造轮子。现有的有三个库都可以用来识别，也都是基于Tesseract的一个封装。

pyocr：Tesseract 和 Cuneiform 的一个封装(wrapper)。

pytesseract：Google Tesseract OCR 的另一个封装(wrapper)。

python-tesseract - Google Tesseract OCR 的一个包装类。

1.安装tesseract

2.安装PyOCR

3.安装Wand和PIL

在我们开始之前，还需要另外安装两个依赖包。一个是Wand。它是Imagemagick的Python接口。

我们需要使用它来将PDF文件转换成图像：

我们也需要PIL因为PyOCR需要使用它。你可以查看官方文档以确定如何将PIL安装到你的操作系统中。

5.开始

现在我们需要获得OCR库（在本例中，即tesseract）的句柄以及我们在PyOCR中将使用的语言：

我们使用tool.get_available_languages里的第二种语言，因为之前我曾尝试过，第二种语言就是英语。

接着，我们需要建立两个列表，用于存储我们的图像和最终的文本。

下一步，我们需要采用wand将一个PDF文件转成jpeg文件。让我们试一试吧！

注意：将PDF_FILE_NAME替换成当前路径下的一个可用的PDF文件名。

wand已经将PDF中所有的独立页面都转成了独立的二进制图像对象。我们可以遍历这个大对象，并把它们加入到req_image序列中去。

现在，我们仅仅需要在图像对象上运行OCR即可，非常简单：

现在，所有识别出的文本已经加到了final_text序列中了。你可以任意地使用它。以上就是利用Python对PDF文件做OCR识别的全部内容，希望这个教程能够帮助到你们！

图像对象语言现在文件

# 上一篇：CSS下拉二级菜单在IE下被挡住显示不了

# 下一篇：记单词的前缀后缀有什么记住这些会不会背单词事半功倍

给您推荐相同类型的内容：

听歌不小心把笔记本电脑用完电了,用完后充电一直充不进怎么回事？
额，楼主笔记本的电源是很烧的，不能用完再充的。估计电源被烧坏了，建议你先买一块电源回来，然后旧的电源拿下来，那到检修的地方检修一下，估计电源用量过度，这个其实满伤的。建议尽量不要等用完了再充，一次不要紧多了就不行了山水一向问题挺多的，不能连
javascript怎么判断字符串是否相等
一般使用双等来判断（==），如果还需要类型相同那么就用三等（===）。说一下这两个的区别：== equality 等同，=== identity 恒等。==，两边值类型不同的时候，要先进行类型转换，再比较。 ==，不做类型转换，类型不同的
css布局的几种方式
左右定宽度，分布向两边浮动，中间如果没设置溢出处理默认宽度是100%，设置后就会截取两边的宽度从而实现中间自适应左右两边定好宽度后，主要用flex:1来占满剩余空间从而实现中间自适应使用table不仅可以在实现页面自适应的部分，
js 如何弹出子窗口后关闭父窗口？
第一个子窗口加入以下代码：x0dx0ax0dx0afunction opensubwin(url) {x0dx0a window.open(url,"_blank")x0dx0a window.c
css怎么写
内嵌样式表&ltSTYLE type="textcss"&gt选择符 { 样式属性：取值样式属性：取值...}&ltSTYLE&gt外部样式表写好了样式之后保存为后缀.css的文件再在
如何让javascript控制css3的animation和transition，让css3反复执行
通过按钮的click事件反复触发一个元素的css3动画，点击一次，动画效果就跑一次。看码——html：&lt!DOCTYPE html&gt&lthtml&gt&lthead&gt
极速10用什么线
VBS-63。VBS-63是一款25磅张力下线径为0.63mm的高弹细线。VBS-63吃球比较深、延展性优秀，其耐用性在细线中比较突出、减震性也很出色，更加适合女性球友及力量相对较小的球友，搭配JS10这样的硬拍也能大大减缓手腕压力。极速1
开学季有什么笔记本电脑推荐吗？
推荐华硕FL8000UFFL8000UF 兼顾美学与性能于一身的佳作。FL8000UF 可选配英特尔® 酷睿™ i7 处理器、支持扩充至 16GB 内存、可选配 NVIDIA® GeForce® MX130 显示核心*，此外，还支持HDD
css选择符有哪些?
1：id选择器（#myid）2:类选择器（.classname）3:标签选择器（div,h1,p）4:相邻选择器（h1+p）5:子选择器（ul&gtli）6:后代选择器（li a）7:通配符选择器（*）一般包括通配、类型、属性选择符
js父节点问题
你看这样是否可以：当单击按钮时触发事件，在这个事件中可以获得srcElement也就是事件节点。通过这个事件节点，我们可以使用标准中parentNode属性，开获得其父节点元素，一直通过这个属性找到type为UL的节点，也就是所有li的父节
JS如何获取值
获取jsfunction返回的值1、首先，使用初始化代码创建一个新的html5文件，如下所示。2、创建一个新的h1标签，以接收js中函数函数的返回值。3、创建新的脚本标记并在标记中创建新函数。该函数返回值22。4、还在h1标记中创建了一个
怎样重装电脑系统？
朋友,你好,如果你想重装系统,我教你几种方法,一定对你终生有用,而且有简单和复杂,你可以选择性学习:(只要你仔细跟着做,就一定学得会)给电脑重做系统一共有六种方法：比如分为：光盘法（分为原盘和GHOST盘两种），U盘法，硬盘法（也叫一键还原
自学Python:用keyword模块查看python关键词
如果你记不住所有的Python关键词，没关系，你可以使用keyword模块查看。具体使用如下： import keyword print(keyword.kwlist) 执行结果如下： ['False
电脑学什么好？
和电脑相关的技能，要么是cg艺术设计，要么是电脑编程，这些都是非常薪资非常不错的工作技能。而且市面上针对这些岗位都有着不少的培训机构，大家也可以根据自己的需求进行选择。下面我就来和大家说说一些发展前景好的行业，供大家参考。一、首先是游戏行业
Python删除最高分最低分次数前2的评委，计算平均分，降序排序怎么实现？
先保存在列表中再去除掉列表中最大和最小，代码如下：n = int(input('请输入删除高分低分前几位：'))contents[95,90,100,80,75,85,75,60,65,80,90,95,85,60]
手机版ckplayer下载
先搜索ckplayer，到官网上下载实例包——打开官网找到下载——把下载下来的文件复制到项目里面——首先要引入js&ltscript type="textjavascript" src="ckplay
java 访问url获取图片
private static final String imgDir="C:Program FilesTencentTM2009Users273367058FileRecv"这里填上图片目录全名就行了st
C语言大整数的四则运算
#include&ltstdio.h&gtint mul(int a[],int k){int i,t=0 for(i=1i&lt=a[0]i++) {a[i]=k*a[i]+t t=a[i]10
500高分,求助修改CSS,高手请进!
无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌无敌
CSS3布局方式有哪些？
1.静态布局——最传统的布局方式，网页中所有尺寸都是由px作为单位，设置了min-width,如果宽度小于就会出现滚动条，如果大于这个宽度则内容居中外加背景实现方式：PC：居中布局，所有样式使用绝对宽度高度(px)，设计一个Layout，
js如何去掉某个字符串最后几位
可以用substring的方法做字符串截取。例如：去掉字符串后3位var str = "abcdefg"var s1 = str.substring(0,str.length-3)在js中去掉字符串最后一位的逗号，就
怎么修改网站的css让它适应手机端？
需要准备的材料分别有：电脑、浏览器、html编辑器。1、首先，打开html编辑器，新建html文件，例如：index.html。2、在index.html中的&lthead&gt标签中，输入meta代码：&ltme
电脑连不上蓝牙怎么回事
电脑连不上蓝牙是因为蓝牙没有打开。解决方法如下所示：打开电脑，找到电脑的控制面板并点击打开；进入控制面板界面之后点击网络连接；进入网络连接之后，点击另外的这一选项找到蓝牙网络连接；右键点击该选项将蓝牙打开，然后将蓝牙设置为可以被
CSS @keyframes规则
@keyframes规则用于指定动画规则，定义一个CSS动画的一个周期的行为；可通过沿动画序列建立关键帧来指定动画序列循环期间的中间步骤。动画是使用可变的CSS样式创建的；在动画期间，CSS属性可以多次更改。定义动画，必须从@keyf
如何用r语言写repeat语句
一、循环和向量化1、控制结构（1）条件语句if(条件）表达式1 else 表达式2（2）循环（loops)for :for(变量 in 变量）表达式while while（条件）表达式repeat repeat 表达式三者略有区别：若知
R语言:如何r语言编写程序求e的近似值，精确到10-5
最简单但计算量最大的是泰勒公式：e=1+11!+12!+13!+14!+...下面是求e的R语言函数：e_fun &lt- function(n) { etemp &lt- 1 ni &lt- 1L
R语言将层次聚类中的树分成簇
R语言将层次聚类中的树分成簇说明在聚类树图中可以观测到聚类的层次，但是仍然得不到组的信息，不过我们可以定义一个聚类树图会拥有多少个簇，并控制树的高度以便将树分成不同的组。操作接上节的数据hc将数据分成四组fit = cutree(hc,4)
怎样给台式电脑的硬盘重新分区？
硬盘分区最快两种方法：1、用软件分区，到网上百度一下“硬盘分区软件”你自己下载一个就可以了。2、右键点击“我的电脑”，选择“管理”命令。在打开的“计算机管理”窗口中，依次展开“计算机管理”→“存储”→“磁盘管理”项。之后，在右侧窗格中即
黄瓜英语
黄瓜的英文是：cucumber。1、读音：英 ['kjuːkʌmbə(r)]；美 ['kjuːkʌmbər] 　　2、含义：n. 黄瓜，用作名词(n.)3、例句：Have some cucumber.译文：吃
义隆单片机休眠和唤醒C语言怎么用
第一块是声明汇编函数，就可以在接下来的C程序中直接调用这些汇编函数来进行底层硬件操作了。第二块声明是为引脚命名。R65，R44这些东西，意义并不明确，为了方便编程，为它们命名一些能够清楚反映它们功能的名字。第三块是声明了一些操作。像P6

推荐阅读

热门文章

最新发布

标签列表

安装百度飞桨OCR库

给您推荐相同类型的内容：