Js 中的 正则表达式?

JavaScript05

Js 中的 正则表达式?,第1张

1定义正则表达式

在js中定义正则表达式很简单,有两种方式,一种是通过构造函数,一种是通过//,也就是两个斜杠。

例如

代码如下:

var re =new RegExp("\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")

使用构造函数定义正则表达式,注意大小写,负责就会不起作用。由于构造函数的参数是一个字符串,也可以是两个斜杠的方式定义,遇到一些特殊字符就需要使用\进行转义

通过双斜杠的方式定义同样的正则表达式

代码如下:

var re =/\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

代码如下:

var re =new RegExp( /^\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/)

可以和构造函数达到同样的效果,但仔细分析,发现,通过构造函数需要更多的转义字符\

2关于验证的三个正则表达式方法

使用正则表达式的主要有字符串的方法match,正则表达式的方法exec,test

正则表达式方法test测试给定的字符串是否满足正则表达式,返回值是bool类型的,只有真和假,如果只是单纯的判断,不需要其他的处理,可以使用尤其是验证时。

代码如下:

function test(){

var text="index.aspx?test=1&ww=2&www=3"//

var re =/\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re =new RegExp("\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")

var result= re.test(text)

if(result)

{

alert("ok")

}else

{

alert("err")

}

}

正则表达式方法exec测试给定的字符串是否满足正则表达式,返回匹配到的字符串,如果没有匹配的则返回null,和test基本一致,如果需要获取匹配的各个子字符串,可以使用下标的方式,把上边的test的例子可以改写如下

代码如下:

function test(){

var text="index.aspx?test=1&ww=2&www=3"

var re = /\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re =new RegExp( "\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")

var result= re.exec(text)

if(result)

{

alert("ok")

alert(result) // 是?test=1&ww=2&www=3,ww=2&

alert(result[0]+",0")//是?test=1&ww=2&www=3

alert(result[1]+",1")//是ww=2&

}else

{

alert("err")

}

}

match其实是字符串的方法,但参数确是一个正则表达式,把上边的例子改写后,如下

代码如下:

function test(){

var text="index.aspx?test=1&ww=234"//

var re = /\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re2 = "(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}"

var result= text.match(re)

if(result)

{

alert(result)//?test=1&ww=234,test=1&

alert(result[0]+",0")//?test=1&ww=234

alert(result[1]+",1")//test=1&

}else

{

alert("err")

}

}

其实字符串类还有多个函数可以传递正则表达式,split,search,replace等但这些方法已经不适合验证了。

代码如下:

function test(){

var text="index.aspx?test=1&ww=234"//

var re = /\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re2 = "(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}"

var result= text.split(re)

alert(result)

alert(result[0]+",0")

alert(result[1]+",1")

}

3正则表达式式的转义字符

在正则表达式中会经常出现转义字符,例如问号?在正则表达式中有特殊的含义,如果需要匹配问号?就需要转义,使用转义字符反斜杠\

如下两个都是匹配问号开头的一段字符串

代码如下:

function test(){

var text="?test=1&ww=2&www=3"

var re = /^\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/// \?表示配置问号?

// var re =new RegExp( "^\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")// \\?表示配置问号?

var result= re.exec(text)

if(result)

{

alert("ok")

alert(result)

alert(result[0]+",0")

alert(result[1]+",1")

}else

{

alert("err")

}

}

首先,你没说你懂那些,全讲又太多,所以说那些一看上去就懵逼的地方,我将解析写在了最后。

因为你问到汉字,我猜你可能不了解 \u4E00-\u9FA5\uF900-\uFA2D 是怎么回事,前面的小 u 代表他们是 Unicode,而后面的区间其实是 Unicode 编码中各个汉字的编码范围,u4E00。

Unicode 编码上规定了基础的汉字是从 u4E00 到 u9FA5,每一个编码代表一个字:

然后 \uF900 到 \uFA2D 同样是指汉字,不过是指那些生僻的字或者是形似的字,算是一种补充说明,不过明显这段代码不是最新的,因为 Unicode 编码是在不断的进步跟收集文字的,看下图可以知道这些补充文字已经超过了 FA2D 的极限,uF900。

仔细看,这些字的写法其实都跟常规的不同,比如那个繁体的“鹤”字跟下面那个全等的“鹤”字其实写法是不一样的,其他的也是如此,也就是说 \uF900-\uFA2D 其实是指字的不同写法,也称兼容字

-----------------------------------------------------------------------------------------------

至于正则的话,用前面一段 /^[\u4E00-\u9FA5\uF900-\uFA2D]{2,4}/ 来解释就是:

^ 表示匹配最开头的。

[1-9] 表示匹配 1 到 9 间的任意数字,所以 [\u4E00-\u9FA5] 就是指匹配区间内全部的汉字。

放在后面的 {2,4} 作用于前面的 [...] 框,用来规定前面的匹配的数量 2<= 匹配数量<=4。

所以 /^[\u4E00-\u9FA5\uF900-\uFA2D]{2,4}/ 其实是说,匹配位于开头的满足[...]框内所有条件的字符(在这里其实就是汉字),因为后面跟着 {2,4} 则在开头的汉字数量我们会根据 2<=汉字数量 <=4 的条件进行匹配(注意五个汉字会匹配前面四个)

结果如下图:

最后注意下 {n,m} 跟 {n} 的效果是不一样的,{n,m} 是 n ~ m 都匹配,而且默认会匹配最大的的数量(贪婪),而 {n} 则是指前面的匹配正好发生了 n 次时才被匹配,那么在后面加上代表最后位置的 $ 符号时,/[...]{n}$ /其实就是指最后一个字符如果符合 [...] 发生 n 次的情况就匹配。

正则不难但是内容挺多的细节也不少,如果在加上 ig 之类的关键字,效果又是不同,到网上自己去搜索比较好。