那些Python中的模块

Python09

那些Python中的模块,第1张

Python的解释环境是很好用,但是如果我们需要编写一个大型的程序的时候,解释环境就完全不够用了。这个时候我们需要将python程序保存在一个文件里。通常这个文件是以.py结尾的。

对于大型的应用程序来说,一个文件可能是不够的,这个时候我们需要在文件中引用其他的文件,这样文件就叫做模块

模块是一个包含Python定义和语句的文件。文件名就是模块名后跟文件后缀 .py 。在模块内部,模块名可以通过全局变量 __name__ 获得。

还是之前的斐波拉赫数列的例子,我们在fibo.py文件中存放了函数的实现:

编写完毕之后,我们可以在Python的解释环境中导入它:

然后直接使用即可:

常用的函数,我们可以将其赋值给一个变量:

或者,我们在导入的时候,直接给这个模块起个名字:

或者导入模块中的函数:

每个模块都有它自己的私有符号表,该表用作模块中定义的所有函数的全局符号表。因此,模块的作者可以在模块内使用全局变量,而不必担心与用户的全局变量发生意外冲突。

前面我们提到了可以使用import来导入一个模块,并且 __name__ 中保存的是模块的名字。

和java中的main方法一样,如果我们想要在模块中进行一些测试工作,有没有类似java中main方法的写法呢?

先看一个例子:

在模块中,我们需要进行一个判断 __name__ 是不是被赋值为 "__main__"。

我们这样来执行这个模块:

以脚本执行的情况下,模块的 __name__ 属性会被赋值为 __main__ , 这也是例子中为什么要这样写的原因。

看下执行效果:

如果是以模块导入的话,那么将不会被执行:

使用import导入模块的时候,解释器首先会去找该名字的内置模块,如果没找到的话,解释器会从 sys.path变量给出的目录列表里寻找。

sys.path的初始目录包括:

要想查看模块中定义的内容,可以使用dir函数。

上面的例子列出了当前模块中定义的内容,包括变量,模块,函数等。

我们可以给dir加上参数,来获取特定模块的内容:

java中有package的概念,用来隔离程序代码。同样的在Python中也有包。

我们看一个Python中包的例子:

上面我们定义了4个包,分别是sound,sound.formats, sound.effects, sound.filters。

__init__.py 可以是一个空文件,也可以执行包的初始化代码或设置 __all__ 变量。

当导入的时候, python就会在 sys.path 路径中搜索该包。

包的导入有很多种方式,我们可以导入单个模块:

但是这样导入之后,使用的时候必须加载全名:

如果不想加载全名,可以这样导入:

那么就可以这样使用了:

还可以直接导入模块中的方法:

然后这样使用:

如果一个包里面的子包比较多,我们可能会希望使用 * 来一次性导入:

那么如何去控制到底会导入effects的哪一个子包呢?

我们可以在 __init__.py 中定义一个名叫 __all__ 的列表,在这个列表中列出将要导出的子包名,如下所示:

这样from sound.effects import * 将导入 sound 包的三个命名子模块。

如果没有定义 __all__,from sound.effects import * 语句 不会 从包 sound.effects 中导入所有子模块到当前命名空间;它只会导入包 sound.effects。

Import 可以指定相对路径,我们使用 . 来表示当前包, 使用 .. 来表示父包。

如下所示:

这个不能一概而论的,据说python目前高达27万+个库,看你学习的方向必学模块也有不同,简单列举:

    1、网络通用方面:

urllib -网络库

requests -网络库

pycurl – 网络库

httplib2 – 网络库

RoboBrowser – 浏览网页

MechanicalSoup -一个与网站自动交互Python库

socket – 底层网络接口

2、爬虫方面:

grab – 爬虫框架

scrapy – 网络爬虫框架,不支持Python3

pyspider –爬虫系统。

cola – 爬虫框架

portia – 可视化爬虫

3、HTML/XML解析方面:

lxml – 高效HTML/ XML处理库

cssselect – 解析DOM树和CSS选择器。

pyquery – 解析DOM树和jQuery选择器。

html5lib – 根据WHATWG规范生成HTML/ XML文档的DOM

feedparser – 解析RSS/ATOM feeds。

MarkupSafe – 为XML/HTML/XHTML提供了安全转义的字符串。

xhtml2pdf – 将HTML/CSS转换为PDF。

untangle – XML文件转Python对象

4、文件处理方面:

xpinyin – 将中国汉字转为拼音

tablib – 数据导出为XLS、CSV、JSON、等格式的模块

textract – 从文件中提取文本

messytables – 解析表格数据

rows – 常用数据接口

Office

python-docx – 读取,查询和修改docx文件

xlwt / xlrd – 从Excel文件读取写入数据和格式信息

PDF

Markdown

Python-Markdown – 一个用Python实现的John Gruber的Markdown。

一、导入模块

import module

from module.xx import xx

from module.xx import xx as rename

from module.xx import *

二、开源模块

yum、pip、apt-get

源码编译安装:Python setup.py build Python setup install

三、常用模块

os模块#用作系统级别的工作

sys模块#提供解释器相关操作

hashlib模块# 用于加密相关的操作

json和pickle模块 #用于序列化数据

subprocess模块

shuit模块 #文件的复制移动

logging模块#格式化记录日志

random模块 用于取随机数

time datetime模块时间模块

re模块 正则匹配