string
matchString =
@"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>"
2,得到网页的标题:
string matchString = @"<title>(?<title>.*)</title>"
3,去掉网页中的所有的html标记:
string temp = Regex.Replace(html, "<[^>]*>", "")//html是一个要去除html标记的文档
4, string matchString = @"<title>([\S\s\t]*?)</title>"
5,js去掉所有html标记的函数:
function delHtmlTag(str)
{
return str.replace(/<[^>]+>/g,"")//去掉所有的html标记
}
可以这么写:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "<html xmlns="
<head>
<title>匹配正则表达式</title>
<meta http-equiv="Content-Type" content="text/html charset=utf-8" />
<script type="text/javascript">
function t1() {
var cont = document.getElementById('cont')
var cv = cont.value
var reg = /<a[\s]+[^>]+>([^<>]+)<\/a>/gi // 正则表达式
alert(cv.replace(reg,''))
}
</script>
<style type="text/css">
textarea {
width:400px
height:200px
}
</style>
</head>
<body>
<p>
<textarea id="cont"></textarea>
</p>
<p><input type="button" value="把链接换成空链接" onclick="t1()" /></p>
</body>
</html>