Python常用包，可以学学这9个

2023-02-28 01:47:02Python049

Python常用包，可以学学这9个,第1张

最近汇总了平时常用到的9个很好的Python包，它们能极大的提高我们的工作效率，安装它们，然后逐步熟练使用它们。

若有用，可以收藏这篇文章。

你若还在为生成名字、地址、IP地址而发愁，试试 Faker 库吧。

它是专业生成假数据的神器，但生成的数据看起来又如此“不假”。

基本用法如下所示：

使用日期和时间格式从来都不是一件有趣的事情。

尽管内置的 datetime 模块做得相当不错，但有一个更直观的 Pendulum ，能做到快速处理。

它支持时区转换、日期、时间操作和格式设置。

如下是一个快速示例，快速创建1个上海时区的时间：

Scrapy是一个强大的工具，可以让你从网站上快速提取信息。

当需要从多个网站或网页中提取大量信息时，手动提取是低效的。

Scrapy提供了易于使用的方法和包，可以使用HTML标记或CSS类提取信息。通过以下命令安装 scrapy :

然后直接在终端输入下面一行代码，

就能得到百度的首页html内容。

Pandas 是一个简单但功能强大的数据分析工具。使用它可以进行数据清洗，并对其进行统计分析。

分析完数据后，还可以使用外部库（如[Matplotlib]）将其可视化(https://github.com/matplotlib/matplotlib).

Pandas最棒的地方是它建在NumPy上面，NumPy是一个强大的数据分析工具，因为Pandas基于它，所以这意味着大多数NumPy方法都是Pandas中已有的函数。

click 是一个Python包，可用于创建命令行接口，相当漂亮的命令行，相当丝滑。

让我们看一个例子：

hello 函数公开了两个参数： count 和 name 。最后，在命令行，直接这样调用脚本：

最后打印：

需要设置web服务器吗？

你有两秒钟的时间吗？因为这就是用Python启动简单web服务器所需的时间，直接下面一行代码：

但对于一个基本的web应用程序来说，这可能太简单了。Flask是一个用Python构建的微web框架。它是“微型”的，因为它没有任何数据库抽象层、表单验证或邮件支持。

幸运的是，它有大量的扩展，可以即插即用，如果只想提供一个简单的API，那么它就是完美的。

要使用Flask创建API服务器，请使用以下脚本：

使用下面一行代码启动服务：

最后，当您在浏览器中访问URL http://127.0.0.1:5000/ 时，

应该会看到以下JSON：

Requests 是一个强大的HTTP库。有了它，可以自动化任何与HTTP请求相关的操作，包括API自动化调用，这样你就不必再手动进行调用。

它附带了一些有用的特性，如授权处理、JSON/XML解析和会话处理。

如下获取明文地址：北京市海淀区清华东路35号，对应的经纬度时，使用百度地图接口，免费注册得到一个apk，返回经纬度结果如下所示：

Selenium是一个编写自动化测试用例的测试框架。

尽管它是用Java编写的，Python包提供对几乎所有Selenium函数的类似API的访问。

Selenium通常用于自动化应用程序UI的测试，但您也可以使用它自动化机器上的任务，如打开浏览器、拖放文件等。

看一个快速示例，演示如何打开浏览器并访问百度主页：

现在，该脚本每15秒刷新浏览器中的百度主页。

很多时候，需要以某种方式修改图像，使其更适合，例如模糊细节、组合一个或多个图像或创建缩略图。

将自制的 Pillow 脚本与 Click 组合在一起，然后直接从命令行访问它们，这对于加快重复的图像处理任务非常有用。

看一个模糊图像的快速示例：

推荐5个常用的Python标准库：

1、os：提供了不少与操作系统相关联的函数库

os包是Python与操作系统的接口。我们可以用os包来实现操作系统的许多功能，比如管理系统进程，改变当前路径，改变文件权限等。但要注意，os包是建立在操作系统的平台上的，许多功能在Windows系统上是无法实现的。另外，在使用os包中，要注意其中的有些功能已经被其他的包取代。

我们通过文件系统来管理磁盘上储存的文件。查找、删除、复制文件以及列出文件列表等都是常见的文件操作。这些功能通常可以在操作系统中看到，但现在可以通过Python标准库中的glob包、shutil包、os.path包以及os包的一些函数等，在Python内部实现。

2、sys：通常用于命令行参数的库

sys包被用于管理Python自身的运行环境。Python是一个解释器，也是一个运行在操作系统上的程序。我们可以用sys包来控制这一程序运行的许多参数，比如说Python运行所能占据的内存和CPU，Python所要扫描的路径等。另一个重要功能是和Python自己的命令行互动，从命令行读取命令和参数。

3、random：用于生成随机数的库

Python标准库中的random函数，可以生成随机浮点数、整数、字符串，甚至帮助你随机选择列表序列中的一个元素，打乱一组数据等。

4、math：提供了数学常数和数学函数

标准库中，Python定义了一些新的数字类型，以弥补之前的数字类型可能的不足。标准库还包含了random包，用于处理随机数相关的功能。math包补充了一些重要的数学常数和数学函数，比如pi、三角函数等等。

5、datetime：日期和时间的操作库

日期和时间的管理并不复杂，但容易犯错。Python的标准库中对日期和时间的管理颇为完善，你不仅可以进行日期时间的查询和变换，还可以对日期时间进行运算。通过这些标准库，还可以根据需要控制日期时间输出的文本格式

Python中6个最重要的库：

第一、NumPy

NumPy是Numerical

Python的简写，是Python数值计算的基石。它提供多种数据结构、算法以及大部分涉及Python数值计算所需的接口。NumPy还包括其他内容：

①快速、高效的多维数组对象ndarray

②基于元素的数组计算或数组间数学操作函数

③用于读写硬盘中基于数组的数据集的工具

④线性代数操作、傅里叶变换以及随机数生成

除了NumPy赋予Python的快速数组处理能力之外，NumPy的另一个主要用途是在算法和库之间作为数据传递的数据容器。对于数值数据，NumPy数组能够比Python内建数据结构更为高效地存储和操作数据。

第二、pandas

pandas提供了高级数据结构和函数，这些数据结构和函数的设计使得利用结构化、表格化数据的工作快速、简单、有表现力。它出现于2010年，帮助Python成为强大、高效的数据分析环境。常用的pandas对象是DataFrame，它是用于实现表格化、面向列、使用行列标签的数据结构以及Series，一种一维标签数组对象。

pandas将表格和关系型数据库的灵活数据操作能力与Numpy的高性能数组计算的理念相结合。它提供复杂的索引函数，使得数据的重组、切块、切片、聚合、子集选择更为简单。由于数据操作、预处理、清洗在数据分析中是重要的技能，pandas将是重要主题。

第三、matplotlib

matplotlib是最流行的用于制图及其他二维数据可视化的Python库，它由John D.

Hunter创建，目前由一个大型开发者团队维护。matplotlib被设计为适合出版的制图工具。

对于Python编程者来说也有其他可视化库，但matplotlib依然使用最为广泛，并且与生态系统的其他库良好整合。

第四、IPython

IPython项目开始于2001年，由Fernando

Pérez发起，旨在开发一个更具交互性的Python解释器。在过去的16年中，它成为Python数据技术栈中最重要的工具之一。

尽管它本身并不提供任何计算或数据分析工具，它的设计侧重于在交互计算和软件开发两方面将生产力最大化。它使用了一种执行-探索工作流来替代其他语言中典型的编辑-编译-运行工作流。它还提供了针对操作系统命令行和文件系统的易用接口。由于数据分析编码工作包含大量的探索、试验、试错和遍历，IPython可以使你更快速地完成工作。

第五、SciPy

SciPy是科学计算领域针对不同标准问题域的包集合。以下是SciPy中包含的一些包：

①scipy.integrate数值积分例程和微分方程求解器

②scipy.linalg线性代数例程和基于numpy.linalg的矩阵分解

③scipy.optimize函数优化器和求根算法

④scipy.signal信号处理工具

⑤scipy.sparse稀疏矩阵与稀疏线性系统求解器

SciPy与Numpy一起为很多传统科学计算应用提供了一个合理、完整、成熟的计算基础。

第六、scikit-learn

scikit-learn项目诞生于2010年，目前已成为Python编程者首选的机器学习工具包。仅仅七年，scikit-learn就拥有了全世界1500位代码贡献者。其中包含以下子模块：

①分类：SVM、最近邻、随机森林、逻辑回归等

②回归：Lasso、岭回归等