正则表达式获取html标签

html-css022

正则表达式获取html标签,第1张

方法1:

var d = document.createElement("div")

d.innerHTML = '<tr><td class="ppprod_lefttd ppprod_cell">上次余额:</td><td class="ppprod_confirm ppprod_cell" id=""><span name="item22" id="item22" delim="" class="" >114.74</span></td></tr>'

alert(d.getElementsByTagName("span")[0].innerText)

用正则

var str = '<tr><td class="ppprod_lefttd ppprod_cell">上次余额:</td><td class="ppprod_confirm ppprod_cell" id=""><span name="item22" id="item22" delim="" class="" >114.74</span></td></tr>'

alert(str.match(/^.*>(\d+(\.?\d+)?)<.*$/)[1])

static void Main(string[] args)

{

String s = @"<Body>

<div>这里是要取出的文本A <img src=""/>这里是要取出的文本B <a href="">超链接里的文本不取出 </a>这里是要取出的文本C </div>

<body>"

Regex regex = new Regex( "(/?\\w+)[^>]*>([^<]*)<", RegexOptions.IgnoreCase )

MatchCollection ms = regex.Matches( s )

foreach( Match m in ms )

{

string tagName = m.Groups[1].Value.ToLower()

string text = m.Groups[2].Value.Trim()

if( tagName != "a" &&text.Length >0 )

Console.WriteLine( text )

}

}

结果:

这里是要取出的文本A

这里是要取出的文本B

这里是要取出的文本C

(.*?)<\/ul>/isU'preg_match_all($reg,$out_msg,$arr)print_r($arr[0][0])echo

"

"print_r($arr[1][0])?>这样获取的$arr[0][0]是你要的所有的标签。

$arr[1][0]是带有<li>****</li>的内容。