“()” 等这些在正则表达式中有特殊意义的字符,要当普通字符使用时,在其前面加'\'即可。
正则表达式中的圆括号的作用:
正则表达式中的圆括号的作用是对字符进行分组,并保存匹配的文本。
圆括号用法I:对字符或元字符进行分组,这样在圆括号内就可以对字符组合使用限定符。
eg. 匹配A+一个数字+A+一个数字:(A\d){2}
圆括号用法II:表示可选择性。
3.1 从两个直接量中选择一个。
eg. gr(a|e)y匹配gray和grey,该例子还可以使用gr[ae]y,字符类效率更高。
3.2 从多个直接量中选择。
eg. (Doctor|Dr\.?)匹配Doctor,Dr,Dr.三种情况。
3.3 错误匹配的交替行为。
使用交替行为时,有时会出现意想不到的错误。
eg. 用(a|ab)匹配ab时,只能匹配a,但是如果用(ab|a),则可以匹配ab。
反向引用(backreferences)。
语法:.NET和JavaScript中,表示匹配第一组的变量被指定为”\1”。
能够体现反向引用的便利性的一种情况是找到句子中重复的单词。
eg. 查找下列句子中重复的单词:
I think that that is often overdone.
This sentence contains contains a doubled word or two two.
查找以下公式:[\((][^\))]+[\))]$,然后替换成空字符串。
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。
许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex”,单数有regexp、regex,复数有regexps、regexes、regexen。