re模块被称为正则表达式,其作用为,创建一个“规则表达式”,用于验证和查找符合规则的文本,广泛用于各种搜索引擎、账户密码的验证等。
预定义字符:
\d:匹配所有的十进制数字0-9
\D:匹配所有的非数字,包含下划线
\s:匹配所有空白字符(空格、TAB等)
\S:匹配所有非空白字符,包含下划线
\w:匹配所有字母、汉字、数字a-z A-Z 0-9
\W:匹配所有非字母、汉字、数字,包含下划线
特殊字符:
$:匹配一行的结尾(必须放在正则表达式最后面)
^:匹配一行的开头(必须放在正则表达式最前面)
*:前面的字符可以出现0次或多次(0~无限)
+:前面的字符可以出现1次或多次(1~无限)
?:变"贪婪模式"为"勉强模式",前面的字符可以出现0次或1次
.:匹配除了换行符"\n"之外的任意单个字符
|:两项都进行匹配
[ ]:代表一个集合,有如下三种情况
[abc]:能匹配其中的单个字符
[a-z0-9]:能匹配指定范围的字符,可取反(在最前面加入^)
[2-9] [1-3]:能够做组合匹配
{ }:用于标记前面的字符出现的频率,有如下情况:
{n,m}:代表前面字符最少出现n次,最多出现m次
{n,}:代表前面字符最少出现n次,最多不受限制
{,m}:代表前面字符最多出现n次,最少不受
{n}:前面的字符必须出现n次
划重点: 这三个概念(库、包、模块)实际上都是模块,只不过是个体和集合的区别。
一个模块就是一个.py文件,里面定义了一些函数和变量,需要的时候就可以导入这些模块(.py文件)。
在模块之上的概念,为了方便管理而将 .py文件 进行打包。包目录下第一个文件便是 init .py(特点),然后是一些模块文件和子目录等。
库:具有相关功能模块的集合。这也是Python的一大特色之一,即具有强大的标准库、第三方库以及自定义模块。
1、系统内置模块
os模块:os模块包含普遍的操作系统功能
sys模块:提供了一系列有关Python运行环境的变量和函数
random模块:random模块用于生成随机数
time 模块: 主要包含各种提供日期、时间功能的类和函数
datetime模块:对time模块的一个高级封装
shutil模块:是一种高层次的文件操作工具
logging模块:将日志打印到了标准输出中
re模块:可以直接调用来实现正则匹配
pymysql模块:连接数据库,并实现简单的增删改查
threading模块:提供了更强大的多线程管理方案
queue模块:实现了多生产者,多消费者的队列
json模块:用于字符串和数据类型间进行转换json
2、开源(三方)模块
Requests:最富盛名的http库。每个Python程序员都应该有它。
Scrapy:从事爬虫相关的工作,这个库也是必不可少的。
NumPy:为Python提供了很多高级的数学方法。
matplotlib:一个绘制数据图的库。对于数据分析师非常有用。
Pygame:开发2D游戏的时候可以用上 。
Scapy:用Python写的数据包探测和分析库。
Django:开源Web开发框架,它鼓励快速开发,并遵循MVC设计,开发周期短。
Py2exe:将python脚本转换为windows上可以独立运行的可执行程序。
BeautifulSoup:基于Python的HTML/XML解析器,简单易用。
PyGtk:基于Python的GUI程序开发GTK+库。
3、自定义模块
自定义模块是自己写的模块,对某段逻辑或某些函数进行封装后供其他函数调用。
注意:自定义模块的命名一定不能和系统内置的模块重名了,否则将不能再导入系统的内置模块了。
例如:自定义了一个sys.py模块后,再想使用系统的sys模块是不能使用的。