java 正则表达式取出标签内的内容

Python020

java 正则表达式取出标签内的内容,第1张

你这个要分2次匹配

第一次取出pd间的数据,正则为:

<pd>([^<]+)</pd>

这个正则的结果$1就是pd间的数据了,再用下面的正则循环匹配,就可以依次得到b, dd,e

/([^/]+)/

Document doc = Jsoup.connect("http://example.com/").get()

Elements links = doc.select("a[href]") // a with href

Jsoup了解一下。