2
3 {
4
5 if (String.IsNullOrEmpty(htmlStr))
6
7 {
8
9 return ""
10
11 }
12
13 string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>" //定义style的正则表达式
14
15 string regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>" //定义script的正则表达式
16
17 string regEx_html = "<[^>]+>" //定义HTML标签的正则表达式
18
19 htmlStr = Regex.Replace(htmlStr, regEx_style, "")//删除css
20
21 htmlStr = Regex.Replace(htmlStr, regEx_script, "")//删除js
22
23 htmlStr = Regex.Replace(htmlStr, regEx_html, "")//删除html标记
24
25 htmlStr = Regex.Replace(htmlStr, "\\s*|\t|\r|\n", "")//去除tab、空格、空行
26
27 htmlStr = htmlStr.Replace(" ", "")
28
29 htmlStr = htmlStr.Replace(""", "")//去除异常的引号" " "
30
31 htmlStr = htmlStr.Replace(""", "")
32
33 return htmlStr.Trim()
34
35 }
在网页中,HTML标签属于特殊字符,如果直接输入就会变成标记,这时就需要特殊字符对照表,将需要显示成特殊字符的转换出来即可。
比如:
<!DOCTYPE html><html lang="en">
<head>
<meta charset="UTF-8">
<title>知道用效果展示</title>
</head>
<body>
<h1>&lta&nbsphref="#"&gt哈哈哈&lt/a&gt</h1>
<h1><a href="#">哈哈哈</a> </h1>
</body>
</html>
效果图:
比如String s="<a href=/"www.baidu.com/"></a>"具体是什么要打印出来才能帮你改~~~,这里值是举例"/"这个能让引号成为html的引号
ps:虽然这样表达消掉引号含义不对,但是对于你好理解