常用的十大python图像处理工具

2023-03-05 00:03:02Python016

常用的十大python图像处理工具,第1张

原文标题：10 Python image manipulation tools.

作者 | Parul Pandey

翻译 | 安其罗乔尔、JimmyHua

今天，在我们的世界里充满了数据，图像成为构成这些数据的重要组成部分。但无论是用于何种用途，这些图像都需要进行处理。图像处理就是分析和处理数字图像的过程，主要旨在提高其质量或从中提取一些信息，然后可以将其用于某种用途。

图像处理中的常见任务包括显示图像，基本操作如裁剪、翻转、旋转等，图像分割，分类和特征提取，图像恢复和图像识别。Python成为这种图像处理任务是一个恰当选择，这是因为它作为一种科学编程语言正在日益普及，并且在其生态系统中免费提供许多最先进的图像处理工具供大家使用。

让我们看一下可以用于图像处理任务中的常用 Python 库有哪些吧。

1.scikit-image

scikit-image是一个开源的Python包，适用于numpy数组。它实现了用于研究，教育和工业应用的算法和实用工具。即使是那些刚接触Python生态系统的人，它也是一个相当简单直接的库。此代码是由活跃的志愿者社区编写的，具有高质量和同行评审的性质。

资源

文档里记录了丰富的例子和实际用例，阅读下面的文档：

http://scikit-image.org/docs/stable/user_guide.html

用法

该包作为skimage导入，大多数功能都在子模块中找的到。下面列举一些skimage的例子：

图像过滤

使用match_template函数进行模板匹配

你可以通过此处查看图库找到更多示例。

2. Numpy

Numpy是Python编程的核心库之一，并为数组提供支持。图像本质上是包含数据点像素的标准Numpy数组。因此，我们可以通过使用基本的NumPy操作，例如切片、掩膜和花式索引，来修改图像的像素值。可以使用skimage加载图像并使用matplotlib显示图像。

资源

Numpy的官方文档页面提供了完整的资源和文档列表：

http://www.numpy.org/

用法

使用Numpy来掩膜图像.

3.Scipy

scipy是Python的另一个类似Numpy的核心科学模块，可用于基本的图像操作和处理任务。特别是子模块scipy.ndimage，提供了在n维NumPy数组上操作的函数。该包目前包括线性和非线性滤波，二值形态学，B样条插值和对象测量等功能函数。

资源

有关scipy.ndimage包提供的完整功能列表，请参阅下面的链接：

https://docs.scipy.org/doc/scipy/reference/tutorial/ndimage.html#correlation-and-convolution

用法

使用SciPy通过高斯滤波器进行模糊：

4. PIL/ Pillow

PIL( Python图像库 )是Python编程语言的一个免费库，它支持打开、操作和保存许多不同的文件格式的图像。然而，随着2009年的最后一次发布，它的开发停滞不前。但幸运的是还有有Pillow，一个PIL积极开发的且更容易安装的分支，它能运行在所有主要的操作系统，并支持Python3。这个库包含了基本的图像处理功能，包括点运算、使用一组内置卷积核的滤波和色彩空间的转换。

资源

文档中有安装说明，以及涵盖库的每个模块的示例：

https://pillow.readthedocs.io/en/3.1.x/index.html

用法

在 Pillow 中使用 ImageFilter 增强图像：

5. OpenCV-Python

OpenCV( 开源计算机视觉库 )是计算机视觉应用中应用最广泛的库之一。OpenCV-Python 是OpenCV的python版API。OpenCV-Python的优点不只有高效，这源于它的内部组成是用C/C++编写的，而且它还容易编写和部署（因为前端是用Python包装的）。这使得它成为执行计算密集型计算机视觉程序的一个很好的选择。

资源

OpenCV-Python-Guide指南可以让你使用OpenCV-Python更容易：

https://github.com/abidrahmank/OpenCV2-Python-Tutorials

用法

下面是一个例子，展示了OpenCV-Python使用金字塔方法创建一个名为“Orapple”的新水果图像融合的功能。

6. SimpleCV

SimpleCV 也是一个用于构建计算机视觉应用程序的开源框架。有了它，你就可以访问几个高性能的计算机视觉库，如OpenCV，而且不需要先学习了解位深度、文件格式、颜色空间等。

它的学习曲线大大小于OpenCV，正如它们的口号所说“计算机视觉变得简单”。一些支持SimpleCV的观点有：

即使是初学者也可以编写简单的机器视觉测试摄像机、视频文件、图像和视频流都是可互操作的资源

官方文档非常容易理解，而且有大量的例子和使用案例去学习：

https://simplecv.readthedocs.io/en/latest/

用法

7. Mahotas

Mahotas 是另一个计算机视觉和图像处理的Python库。它包括了传统的图像处理功能例如滤波和形态学操作以及更现代的计算机视觉功能用于特征计算，包括兴趣点检测和局部描述符。该接口是Python语言，适合于快速开发，但是算法是用C语言实现的，并根据速度进行了调优。Mahotas库速度快，代码简洁，甚至具有最小的依赖性。通过原文阅读它们的官方论文以获得更多的了解。

资源

文档包括安装指导，例子，以及一些教程，可以更好的帮助你开始使用mahotas。

https://mahotas.readthedocs.io/en/latest/install.html

用法

Mahotas库依赖于使用简单的代码来完成任务。关于‘Finding Wally’的问题，Mahotas做的很好并且代码量很少。下面是源码：

https://mahotas.readthedocs.io/en/latest/wally.html

8. SimpleITK

ITK 或者 Insight Segmentation and Registration Toolkit是一个开源的跨平台系统，为开发人员提供了一套广泛的图像分析软件工具。其中, SimpleITK是建立在ITK之上的简化层，旨在促进其在快速原型设计、教育、解释语言中的应用。SimpleITK 是一个图像分析工具包，包含大量支持一般过滤操作、图像分割和匹配的组件。SimpleITK本身是用C++写的，但是对于包括Python以内的大部分编程语言都是可用的。

资源

大量的Jupyter Notebooks 表明了SimpleITK在教育和研究领域已经被使用。Notebook展示了用Python和R编程语言使用SimpleITK来进行交互式图像分析。

http://insightsoftwareconsortium.github.io/SimpleITK-Notebooks/

用法

下面的动画是用SimpleITK和Python创建的刚性CT/MR匹配过程的可视化。点击此处可查看源码！

9. pgmagick

pgmagick是GraphicsMagick库的一个基于python的包装。 GraphicsMagick图像处理系统有时被称为图像处理的瑞士军刀。它提供了一个具有强大且高效的工具和库集合，支持以88种主要格式(包括重要格式，如DPX、GIF、JPEG、JPEG-2000、PNG、PDF、PNM和TIFF)读取、写入和操作图像。

资源

有一个专门用于PgMagick的Github库，其中包含安装和需求说明。还有关于这个的一个详细的用户指导：

https://github.com/hhatto/pgmagick

用法

使用pgmagick可以进行的图像处理活动很少，比如：

图像缩放

边缘提取

10. Pycairo

Pycairo是图像处理库cairo的一组Python捆绑。Cairo是一个用于绘制矢量图形的2D图形库。矢量图形很有趣，因为它们在调整大小或转换时不会失去清晰度。Pycairo是cairo的一组绑定，可用于从Python调用cairo命令。

资源

Pycairo的GitHub库是一个很好的资源，有关于安装和使用的详细说明。还有一个入门指南，其中有一个关于Pycairo的简短教程。

库：https://github.com/pygobject/pycairo指南：https://pycairo.readthedocs.io/en/latest/tutorial.html用法

使用Pycairo绘制线条、基本形状和径向梯度：

总结

有一些有用且免费的Python图像处理库可以使用，有的是众所周知的，有的可能对你来说是新的，试着多去了解它们。

本文介绍了用python与文件进行交互的方法，分享给大家，具体如下：一.文件处理1.介绍计算机系统：计算机硬件,操作系统,应用程序应用程序无法直接操作硬件，通过操作系统来操作文件，进而读/写硬件中的文件。python打开文件过程：#打开f=open('a.txt','r')#通过句柄对文件进行操作 read()_f=f.read()#关闭文件f.close()with open('a.txt','r') as f: #不需要关闭f.close() #回收操作系统打开的文件del f #回收应用程序级的变量2.打开文件的模式a.打开文本文件#r,只读模式【默认模式，文件必须存在，不存在则抛出异常】f=open('a.txt',encoding='utf-8')data1=f.read()print(f.readline(),end='')print(f.readlines())#w,只写模式【不可读；不存在则创建；存在则清空内容】f=open('a.txt','w',encoding='utf-8')f.write('werf')#a,只追加写模式【不可读；不存在则创建；存在则只追加内容】f=open('a.txt','a',encoding='utf-8')f.write('werf\n')b.对于非文本文件，只能使用b模式，"b"表示以字节的方式操作（而所有文件也都是以字节的形式存储的，使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式with open('1.jpg','rb') as f_read:data=f_read.read()print(data)with open('a.txt','rb') as f_read:data=f_read.read().decode('utf-8') #解码print(data)with open('a.txt','wb')as f_write:f_write.write('adsf'.encode('utf-8'))'''练习，利用b模式，编写一个cp工具，要求如下：1. 既可以拷贝文本又可以拷贝视频，图片等文件2. 用户一旦参数错误，打印命令的正确使用方法，如usage: cp source_file target_file'''import sysif len(sys.argv)!=3:print('usage:cp source_file target_file')sys.exit()source_file,target_file=sys.argv[1],sys.argv[2]print()with open(source_file,'rb')as f_read,open(target_file,'wb')as f_write:for line in f_read:f_write.write(line)3.文件内光标的移动#以文本模式读文件，n代表的是字符的个数with open('a.txt','r')as f_read:data=f_read.read(6)print(data)#以b模式读文件，n代表的是字节的个数with open('a.txt','rb')as f_read:data=f_read.read(6)print(data)# tell：告诉当前光标的位置with open('a.txt','r',encoding='utf-8')as f_read:data=f_read.read(4)data1=f_read.tell()print(data,data1)# seek：移动光标（0：文件开头默认；1：文件当前光标；2：文件末尾）with open('a.txt', 'r', encoding='utf-8')as f_read:data = f_read.seek(3)data1 = f_read.read()print(data, data1)# 实现tail功能import timewith open('access.log', 'rb')as f_read:f_read.seek(0,2)while True:line = f_read.readline()if line:print(line.decode('utf-8'),end='')else:time.sleep(1)4.文件的修改import oswith open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:for line in read_f:line=line.replace('alex','SB')write_f.write(line)os.remove('a.txt')os.rename('.a.txt.swap','a.txt')

实战小程序：画出y=x^3的散点图

样例代码如下：

[python] view plain copy

#coding=utf-8

import pylab as y #引入pylab模块

x = y.np.linspace(-10, 10, 100) #设置x横坐标范围和点数

y.plot(x, x*x*x,'or') #生成图像

ax = y.gca()

ax.spines['right'].set_color('none')

ax.spines['top'].set_color('none')

ax.xaxis.set_ticks_position('bottom')

ax.spines['bottom'].set_position(('data', 0))