Js 中的正则表达式?

2023-03-01 23:15:02JavaScript019

Js 中的正则表达式?,第1张

1定义正则表达式

在js中定义正则表达式很简单，有两种方式，一种是通过构造函数，一种是通过//，也就是两个斜杠。

例如

代码如下:

var re =new RegExp("\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")

使用构造函数定义正则表达式，注意大小写，负责就会不起作用。由于构造函数的参数是一个字符串，也可以是两个斜杠的方式定义，遇到一些特殊字符就需要使用\进行转义

通过双斜杠的方式定义同样的正则表达式

代码如下:

var re =/\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

代码如下:

var re =new RegExp( /^\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/)

可以和构造函数达到同样的效果，但仔细分析，发现，通过构造函数需要更多的转义字符\

2关于验证的三个正则表达式方法

使用正则表达式的主要有字符串的方法match，正则表达式的方法exec，test

正则表达式方法test测试给定的字符串是否满足正则表达式，返回值是bool类型的，只有真和假，如果只是单纯的判断，不需要其他的处理，可以使用尤其是验证时。

代码如下:

function test(){

var text="index.aspx?test=1&ww=2&www=3"//

var re =/\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re =new RegExp("\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")

var result= re.test(text)

if(result)

{

alert("ok")

}else

{

alert("err")

}

正则表达式方法exec测试给定的字符串是否满足正则表达式，返回匹配到的字符串，如果没有匹配的则返回null，和test基本一致，如果需要获取匹配的各个子字符串，可以使用下标的方式，把上边的test的例子可以改写如下

代码如下:

function test(){

var text="index.aspx?test=1&ww=2&www=3"

var re = /\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re =new RegExp( "\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")

var result= re.exec(text)

if(result)

{

alert("ok")

alert(result) // 是?test=1&ww=2&www=3,ww=2&

alert(result[0]+",0")//是?test=1&ww=2&www=3

alert(result[1]+",1")//是ww=2&

}else

{

alert("err")

}

match其实是字符串的方法，但参数确是一个正则表达式，把上边的例子改写后，如下

代码如下:

function test(){

var text="index.aspx?test=1&ww=234"//

var re = /\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re2 = "(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}"

var result= text.match(re)

if(result)

{

alert(result)//?test=1&ww=234,test=1&

alert(result[0]+",0")//?test=1&ww=234

alert(result[1]+",1")//test=1&

}else

{

alert("err")

}

其实字符串类还有多个函数可以传递正则表达式，split，search，replace等但这些方法已经不适合验证了。

代码如下:

function test(){

var text="index.aspx?test=1&ww=234"//

var re = /\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re2 = "(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}"

var result= text.split(re)

alert(result)

alert(result[0]+",0")

alert(result[1]+",1")

}

3正则表达式式的转义字符

在正则表达式中会经常出现转义字符，例如问号?在正则表达式中有特殊的含义，如果需要匹配问号?就需要转义，使用转义字符反斜杠\

如下两个都是匹配问号开头的一段字符串

代码如下:

function test(){

var text="?test=1&ww=2&www=3"

var re = /^\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/// \?表示配置问号?

// var re =new RegExp( "^\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")// \\?表示配置问号?

var result= re.exec(text)

if(result)

{

alert("ok")

alert(result)

alert(result[0]+",0")

alert(result[1]+",1")

}else

{

alert("err")

}

首先，你没说你懂那些，全讲又太多，所以说那些一看上去就懵逼的地方，我将解析写在了最后。

因为你问到汉字，我猜你可能不了解 \u4E00-\u9FA5\uF900-\uFA2D 是怎么回事，前面的小 u 代表他们是 Unicode，而后面的区间其实是 Unicode 编码中各个汉字的编码范围，u4E00。

Unicode 编码上规定了基础的汉字是从 u4E00 到 u9FA5，每一个编码代表一个字：

然后 \uF900 到 \uFA2D 同样是指汉字，不过是指那些生僻的字或者是形似的字，算是一种补充说明，不过明显这段代码不是最新的，因为 Unicode 编码是在不断的进步跟收集文字的，看下图可以知道这些补充文字已经超过了 FA2D 的极限，uF900。

仔细看，这些字的写法其实都跟常规的不同，比如那个繁体的“鹤”字跟下面那个全等的“鹤”字其实写法是不一样的，其他的也是如此，也就是说 \uF900-\uFA2D 其实是指字的不同写法，也称兼容字。

-----------------------------------------------------------------------------------------------

至于正则的话，用前面一段 /^[\u4E00-\u9FA5\uF900-\uFA2D]{2,4}/ 来解释就是：

^ 表示匹配最开头的。

[1-9] 表示匹配 1 到 9 间的任意数字，所以 [\u4E00-\u9FA5] 就是指匹配区间内全部的汉字。

放在后面的 {2,4} 作用于前面的 [...] 框，用来规定前面的匹配的数量 2<= 匹配数量<=4。

所以 /^[\u4E00-\u9FA5\uF900-\uFA2D]{2,4}/ 其实是说，匹配位于开头的满足[...]框内所有条件的字符(在这里其实就是汉字)，因为后面跟着 {2,4} 则在开头的汉字数量我们会根据 2<=汉字数量 <=4 的条件进行匹配（注意五个汉字会匹配前面四个）。

结果如下图：

最后注意下 {n,m} 跟 {n} 的效果是不一样的，{n,m} 是 n ~ m 都匹配，而且默认会匹配最大的的数量（贪婪），而 {n} 则是指前面的匹配正好发生了 n 次时才被匹配，那么在后面加上代表最后位置的 $ 符号时，/[...]{n}$ /其实就是指最后一个字符如果符合 [...] 发生 n 次的情况就匹配。

正则不难但是内容挺多的细节也不少，如果在加上 ig 之类的关键字，效果又是不同，到网上自己去搜索比较好。

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：使用HTML模板输入中文出现乱码

# 下一篇：css 怎么在ul里面的li 的文字如何让它折行？