正则表达式之前瞻后顾(look around)

JavaScript014

正则表达式之前瞻后顾(look around),第1张

文中所说的前后是有方向的,未免产生歧义,在此声明下

如A =>B

我们说B在A的前面,A在B的后面

想要匹配abc并且abc的前面是123的表达式,应该这样:

想要匹配abc并且abc的前面不是123的表达式,应该这样:

想要匹配abc并且abc的后面是123的表达式, 尴尬的是js不支持后顾,只支持前瞻,所以用js匹配会这样:

所以我换了 sublime 编辑器,因为 sublime 是用 python 写的,所以会得到这样的结果:

想要匹配abc并且abc的后面不是123的表达式,应该这样:

当然,在js中也是不支持负后顾的,不过似乎有提案让js支持后顾,相信过几年js就可以支持后顾了。

js匹配是js中比较重要的一个概念,我们在工作中经常用到,但是往往都是记得不是很清楚,或者有些遗忘,这次记录总结一下,让自己加深一下印象,同时也会小伙伴们提供查阅资料的地方

正则匹配模式分为两种,一种是贪婪模式,另一种是非贪婪模式

贪婪模式:在遇到歧义时候尽可能的多的匹配符合的结果

非贪婪匹配:在遇到歧义时候匹配到一次符合的结果就不匹配了

js默认是贪婪匹配模式,贪婪模式变成非贪婪模式只需要在贪婪量词({n, }, {n, m}, + , ?, *)后面加一个?就行了

附加: 正则匹配中?的几种用法

正则匹配的前瞻就是给正则匹配的选项定义一个断言,或者说是一个条件比如:我要匹配一个字母,但是我的需求是字母后面必须是跟着一个数字的情况,那么这种场景是怎么实现了,就是用到前瞻的概念,那么我想要他的前面也要是一个数字怎么办了,这就是后顾。

前瞻后顾的描述

正则匹配新特性

以上的三个匹配形式都是不被捕获的,其中前两个是不匹配的,他只是用来当作条件来用,第三个是要被匹配的

1:任何元字符在没有写量词的情况下,只匹配一次

2:写了量词,默认是贪婪匹配

3:正则匹配一旦全部找到就不会在继续去匹配,除非你设置了全局g

4:正则匹配按照匹配规如果中间中断没有匹配到,并且字符串没有匹配完,会继续按照匹配规则重新匹配

5:(pattern)如果匹配到了很多结果,只捕获最后一次匹配到的结果

6:任何量词都只作用于前面的元字符

1:source 2:global 3:ingoreCase 4:multiline 5:lastIndex

字符串满足正则匹配规则就会返回true,但是如果正则匹配里面含有全局的话,那么多运行几遍会报错,因为正则每次匹配开始都是看lastIndex的,全局情况下lastIndex每次执行都会被改变

如果没有找到任何匹配就返回null,如果找到了则返回一个数组,exec方法返回的数组的第 0 个元素是与正则表达式相匹配的文本

第 1 个元素是 正则匹配到 的第 1 个子表达式相匹配的文本(如果有的话)

第 2 个元素是正则匹配到 的第 2 个子表达式相匹配的文本(如果有的话)

...

以此类推。

其中还有三个参数

index:表示匹配到的文本的第一个字符所在的索引位置

input: 表示被匹配的文本

groups:表示有名的分组

在全局下也是一样因为exec永远只返回第一个匹配。

如果没有找到任何匹配就返回null,如果找到了则返回一个数组,match方法返回的数组的第 0 个元素是与正则表达式相匹配的文本

第 1 个元素是 正则匹配到 的第 1 个子表达式相匹配的文本(如果有的话)

第 2 个元素是正则匹配到 的第 2 个子表达式相匹配的文本(如果有的话)

...

以此类推。

其中还有三个参数

index:表示匹配到的文本的第一个字符所在的索引位置

input: 表示被匹配的文本

groups:表示有名的分组

在非全局的情况下,这个方法和exec一模一样,但是在全局的情况下,差别很大,在全局的情况下,只会返回匹配到的结果,并且lastIndex始终为0, 如果没匹配到就返回null

该方法用来替换字符串,第一个参数是正则表达式,第二个参数可以是字符串也可以是函数

正则匹配测试工具