匹配两个特定字符间的内容由以下两种方法:
1.以组形式捕获
Reference:(.*?)About the author //多行模式 捕获组1
以下是java语法
String regex = "Reference:(.*?)About the author" //此为表达式
String input = ""//此为待搜索的字符串
Pattern p = Pattern.compile(regex,Pattern.DOTALL) //多行模式
Matcher matcher = p.matcher(input)
ArrayList<String>list = new ArrayList<String>()
if (matcher.find()) {
list.add(matcher.group(1)) //这个地方捕获组1
}
// list 就是搜索的结果
如果是单行模式请注意,表达式应写为:
Reference:((.|\r\n)*?)About the author //单行模式 捕获组1
2.使用零宽断言,表达式如下:
(?<=Reference:).*?(?=About the author)
Java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承、指针等概念,因此Java语言具有功能强大和简单易用两个特征。Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进行复杂的编程 。
Java具有简单性、面向对象、分布式、健壮性、安全性、平台独立与可移植性、多线程、动态性等特点 。Java可以编写桌面应用程序、Web应用程序、分布式系统和嵌入式系统应用程序等。
你所说的 “第二个结果”,并不是真的第二个,而是因为你的正则表达式中有括号。在使用 match 时,会将每个括号匹配到的也一起返回。
例如:
'thisabcd'.match(/a(.)(.)/)会返回 ['abc', 'b', 'c']
以上,请采纳,请给分。
给你个例子,你自己看看吧。平衡组/递归匹配
如何把xx <aa <bbb><bbb>aa>yy这样的字符串里,最长的配对的尖括号内的内容捕获出来?
这里需要用到以下的语法构造:
(?'group') 把捕获的内容命名为group,并压入堆栈(Stack)
(?'-group') 从堆栈上弹出最后压入堆栈的名为group的捕获内容,如果堆栈本来为空,则本分组的匹配失败
(?(group)yes|no) 如果堆栈上存在以名为group的捕获内容的话,继续匹配yes部分的表达式,否则继续匹配no部分
(?!) 零宽负向先行断言,由于没有后缀表达式,试图匹配总是失败
我们需要做的是每碰到了左括号,就在压入一个"Open",每碰到一个右括号,就弹出一个,到了最后就看看堆栈是否为空--如果不为空那就证明左括号比右括号多,
那匹配就应该失败。正则表达式引擎会进行回溯(放弃最前面或最后面的一些字符),尽量使整个表达式得到匹配。
平衡组一个匹配嵌套的<div>标签:
<div[^>]*>[^<>]*(((?'open'<div[^>]*)[^<>]*)+(?'-open'</div>)[^<>]*)+)*(?(open)(?!))</div>