string
matchString =
@"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>"
2,得到网页的标题:
string matchString = @"<title>(?<title>.*)</title>"
3,去掉网页中的所有的html标记:
string temp = Regex.Replace(html, "<[^>]*>", "")//html是一个要去除html标记的文档
4, string matchString = @"<title>([\S\s\t]*?)</title>"
5,js去掉所有html标记的函数:
function delHtmlTag(str)
{
return str.replace(/<[^>]+>/g,"")//去掉所有的html标记
}
split() 方法用于把一个字符串分割成字符串数组。
语法
stringObject.split(separator,howmany)
参数
separator 必需。字符串或正则表达式,从该参数指定的地方分割 stringObject。
howmany 可选。该参数可指定返回的数组的最大长度。如果设置了该参数,返回的子串不会多于这个参数指定的数组。如果没有设置该参数,整个字符串都会被分割,不考虑它的长度。
返回值
一个字符串数组。该数组是通过在 separator 指定的边界处将字符串 stringObject 分割成子串创建的。返回的数组中的字串不包括separator 自身。
如果想通过正则表达式,完成按引号中的逗号进行拆分,下面是代码,仅供参考:
var str = 'sdfs,dhf,skjdf","sdfsdfsdfsd","sdfe'str.split(/\",\"/g)
----> ["sdfs,dhf,skjdf", "sdfsdfsdfsd", "sdfe"]