Python性能优化：增大正则表达式编译缓存

2023-02-27 06:01:02Python018

Python性能优化：增大正则表达式编译缓存,第1张

关键词：正则表达式 | 缓存 | 性能优化

Python 3 的 re 库中，对正则表达式的编译函数 re.compile() 调用了私有函数 re._compile() ，但更根本上编译的计算是由 sre_compile.compile() 完成的，而 re._compile() 中对编译好的表达式进行了缓存，使用 _MAXCACHE 将缓存大小硬编码为512。以下是 re._compile() 的源码，摘自： https://github.com/python/cpython/blob/3.5/Lib/re.py (3.6，3.7里也没有变化)

在某些 大规模应用场景 下，512的缓存显然太小了一些，为了摆脱这个瓶颈但不去碰cpython的源码，我们可以自己改写 re._compile() ，从而实现自定义缓存大小（ max_regex_cache ），轻松排个10000出来。原函数里很多语句都不知道干嘛用的，但照葫芦画瓢总没错。

调用方法：

进一步优化是将这个类变成Singleton（之后我应该会专门写一篇），以及多模块共享。

1.把range全部换成xrange

2.生成器，如 list=(item for item in fp)

3.利用psyco库，提高函数和类的运行效率。

4.字符串拼接：尽量少用“+”的方式，而采用''.join ，还有"%s"%i这样赋值的手段

5.函数的开销很大。尽量把循环放在函数内进行。而不要让每次迭代都调用函数。

6.“前提工作”先做好，比如该赋值，该拼接的，然后再引入到函数中，或者进行下面的循环。

7.尽量使用内置方法，因为内置的是C写的，效率肯定高很多

8.每当要对序列中的内容进行循环处理时，就应当尝试用列表解析来代替它，如：[i for i in xrang(10) if i%2==0]

9.学会使用itertools模块。当python中添加了迭代器后，就为常见模式提供了一个新的模块，因为它是以C语言编写，所以提供了最高效的迭代器。

--多记录一些。列表，字符串，字典，xrange,类文件对象，这些都是可迭代对象，换句话说，都可以直接用在for循环中进行迭代，如for item in open('1.txt')

--直接使用速度会快。另外，我对比了itertools里工具和xrange，比如都循环100000次打印数字，使用islice(count(),100000)均要比xrange(100000)快

--而xrange还要比range快。

10.用列表解析取代for循环。列表解析的效率等于或高于map。

11.垃圾回收机制，会对列表的操作有重大影响，如列表的append，或者列表解析。import gc，然后在数据载入模块前gc.disable（）,结束后再gc.enable()。

函数缓存列表迭代赋值

# 上一篇：单片机c语言中delay（）函数的头文件是什么？

# 下一篇：Go语言中恰到好处的内存对齐

给您推荐相同类型的内容：

java中对象实体与对象的引用有何不同？
对象引用的目的地才是对象的实体。在java引用对象的赋值中，实际上是对引用的赋值；而对象实体不发生变换。特别能够说明问题的是在引用型对象用final 关键字修饰的时候，表示引用的确定而不是对象实体的不可变。final StringBuffe
python基础:数据分析常用包
1. NumpyPython没有提供数组功能，Numpy可以提供数组支持以及相应的高效处理函数，是Python数据分析的基础，也是SciPy、Pandas等数据处理和科学计算库最基本的函数功能库，且其数据类型对Python数据分析十分有用。
r语言中，== 和=,<-的区别是什么？
r语言中= 和=,&lt-功能是相同，有时候=会出错，所以用&lt-。但是从字面上解释，通常“&lt-”被认为是赋值，”=”是传值。在函数调用中，func(x=1)与func(x&lt-1)是有区别的，前者调
c#将文件转为json和xml
json的话，目前比较流行的转换工具是fastjson，使用方便，速度又很快。。可以在JavaBean和String型之间直接转换xml的话，可以采用XStream来转换。。。也就是说，你可以先把json的文件内容转换成JavaBean（f
在java中如何输入一个char型字符。
可以创建Scanner类来从键盘输入一个字符，用String类型来接收，再使用String的charAt功能，具体步骤如下：1、先创建一个Scanner对象，如：Scanner sc = new Scanner(System.in)2、然
java调用自己的画图方法
可以调用draw方法, 但是你就这样写,无法直观的显示出来. 要想真的显示出来 ,你需要在面板上绘制,并添加到窗口上.下面是参考代码import java.awt.EventQueueimport java.awt.Graphicsim
在java中如何输入一个char型字符。
可以创建Scanner类来从键盘输入一个字符，用String类型来接收，再使用String的charAt功能，具体步骤如下：1、先创建一个Scanner对象，如：Scanner sc = new Scanner(System.in)2、然
Java的split（）是怎么拆分字符串的？
java拆分字符串使用string类的spilt方法，针对某个分隔符来分割一个字符串，示例如下：x0dx0apublic class StringSplit {x0dx0apublic static void main(String
R语言计算β多样性指数及分析
计算β多样性指数需要用到phyloseq包。它的安装方式不同于简单的install.packages（“phyloseq”）有两种方法可以安装 1.先安装BiocManager install.packages("B
Genevieve Cortese在邪恶力量演的谁？
《邪恶力量》(Supernatural)第三季中，在鲁比(Ruby，杰娜微弗-库塔希饰演)出现时他就是一个极具争议的角色，即使杰娜微弗-库塔希(Genevieve Cortese)在表演方面很下功夫。业内人士评论库塔希的表演不够饱满，但也有
如何在windows下安装GIT
本文在Windows7下测试成功。安装和设置Git下载Git for Windows，采用默认安装，安装完成后就可以在本地使用Git了。但要将内容放到Github上，必须先在Github网站上注册个账户，然后在本机使用Git创建SSH Ke
c语言的两种排序？
1、选择排序法要求输入10个整数，从大到小排序输出输入：2 0 3 -4 8 9 5 1 7 6输出：9 8 7 6 5 3 2 1 0 -4代码：#include&ampltstdio.h&ampgtint m
tell me why 是谁唱的？他还有什么好歌？
DeclanGalbraith唱的 01.DannyBoy02.Carrickfergus03.Imagine04.I'llBeThere05.ItAllBeginsWithLove06.YourFriend07.LoveCanB
C语言数据结构中KMP算法编程中的问题
问题出在void StrCreate(Sqstring *s)这个函数中，你在函数内给形参malloc内存，这些内存在函数返回时会被回收，因此相当于你没有分配内存。解决的方法就是在main中分配内存，而不是在create中，或者也可以将cr
如何使用Go语言实现远程执行命令
一般命令所谓一般命令，就是在一定时间内会执行完的命令。比如 grep, cat 等等。执行命令的步骤是：连接，执行，获取结果连接连接包含了认证，可以使用 password 或者 sshkey 2种方式来认证。下面的示例为了简单，使用了密码
python工具有哪些
第一款：最强终端 Upterm它是一个全平台的终端，可以说是终端里的IDE，有着强大的自动补全功能，之前的名字叫作：BlackWindow。有人跟他说这个名字不利于社区推广，改名叫Upterm之后现在已经17000+Star了。第二款：交互
「测试开发全栈化-Go」(1) Go语言基本了解
作为一个测试，作为一个测试开发，全栈化+管理是我们未来的发展方向。已经掌握了Java、Python、HTML的你，是不是也想了解下最近异常火爆的Go语言呢？来吧，让我们一起了解下。Go 是一个开源的编程语言
Ruby那把刀有谁知道来历
童子切（平假名：どうじぎり）有名的日本刀，被指定为日本国宝。这把刀的名字经常与其制作者的名字连在一起，被称做童子切安纲（どうじぎりやすつな）。童子切是所谓的天下五剑（大典太光世、三日月宗近、数珠丸恒次、童子切安纲和鬼丸国纲）之一，现藏于东
怎么样学习R语言？
1.初级入门《An Introduction to R》，这是官方的入门小册子。其有中文版，由丁国徽翻译，译名为《R导论》。《R4Beginners》，这本小册子有中文版应该叫《R入门》。除此之外，还可以去读刘思喆的《153分钟学会R》。
linux运维平时工作主要负责哪些内容？
1.6 Linux运维岗位及工作内容互联网Linux运维工程师是一个融合多学科(网络、系统、开发、数据库、安全、存储等)的综合性技术岗位，甚至还需要沟通、为人处世、培训、销售、管理等非技术能力，这给运维工程师提供了一个广阔的发展空间。1.数
Python有哪些常用的数据类型?
Numbers(数字型)：即我们常说的1，2，3等等这些数字，Python有两个常见的数据类型转化函数：int和float，一般数据类型可以用来做一些算术功能，如加减乘除乘方等等，还可以用作比较功能，一般返回的是true和false，也就
ruby女孩名字是什么寓意？
有珍贵、高雅、尊贵，不凡气质的寓意。ruby的发音听起来较为的中性化，但是也不失女性的柔美色彩，作为女孩英文名字，听起来落落大方，好听又独特。本指的是红宝石的意思，红宝石象征珍贵、高雅、尊贵，形容出了女孩的不凡气质。女孩提取此英文作为英文
Go指针的理解
1.指针的作用指针类型用于传递地址, 而不是传递值,这样做的好处是避免值的体积过大, 影响传递的效率2.指针的运算符1）*：*有两个作用 ①指针变量声明：var a *string ②从指针变量中取值：
pic系列单片机用c语言编程时，让他执行AD转换的指令是什么？
在C语言里没有指令，只有语句，用C语言执行AD转换如下：AD转换初始化子程序voidadinitial(){ADCON0=0x41；选择AD通道为RA0，且打开AD转换器在工作状态，使AD转换时钟为8ToscADCON
Go语言中恰到好处的内存对齐
在开始之前，希望你计算一下Part1共占用的大小是多少呢？输出结果：这么一算， Part1这一个结构体的占用内存大小为 1+4+1+8+1 = 15 个字节。相信有的小伙伴是这么算的，看上去也没什么毛病真实情
将文件导入文件夹c语言是什么
操作文件的正确流程为：打开文件 --&gt读写文件 --&gt关闭文件。文件在进行读写操作之前要先打开，使用完毕要关闭。所谓打开文件，就是获取文件的有关信息，例如文件名、文件状态、当前读写位置等，这些信息会被保存到一个 FI
Go语言的应用
Go语言由Google公司开发，并于2009年开源，相比JavaPythonC等语言，Go尤其擅长并发编程，性能堪比C语言，开发效率肩比Python，被誉为“21世纪的C语言”。Go语言在云计算、大数据、微服务、高并发领域应用应用非常广
java中怎么把字符串转化为字符串数组？
1，如果是“字符串数组”转“字符串”，只能通过循环，没有其它方法String[]str={"abc","bcd","def"}StringBuffersb=newStringBu
c语言编写atm如何修改密码
步骤： 1. 使用C语言编写atm程序，实现密码修改的功能。 2. 需要设置一个全局变量来存储当前用户的密码信息。 3. 在主函数中，定义一个函数，用于输入原密码和修改后的新密码。 4. 在输入新密码之前，需要验证输入的原密码是否正确。 5
[R语言] Heatmap绘图经验总结
这里随机生成了25个0,1之间的均匀分布的随机数，其中，行是样本，列是特征，如图：第一种方案绘制的Heatmap需要借助于Corrplot包，我们求出dat特征的相关系数矩阵，进一步利用corrplot函数来画图，在该包的官方文档中，

推荐阅读

热门文章

最新发布

标签列表

Python性能优化：增大正则表达式编译缓存

给您推荐相同类型的内容：