怎么去除字符串中的html标签

html-css07

怎么去除字符串中的html标签,第1张

去除字符串中的html标签: 1 public static string Html2Text(string htmlStr)

3 {

5     if (String.IsNullOrEmpty(htmlStr))

7     {

9         return ""

10 

11     }

12 

13     string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>" //定义style的正则表达式 

14 

15     string regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>" //定义script的正则表达式   

16 

17     string regEx_html = "<[^>]+>" //定义HTML标签的正则表达式   

18 

19     htmlStr = Regex.Replace(htmlStr, regEx_style, "")//删除css

20 

21 htmlStr = Regex.Replace(htmlStr, regEx_script, "")//删除js

22 

23     htmlStr = Regex.Replace(htmlStr, regEx_html, "")//删除html标记

24 

25     htmlStr = Regex.Replace(htmlStr, "\\s*|\t|\r|\n", "")//去除tab、空格、空行

26 

27     htmlStr = htmlStr.Replace(" ", "")

28 

29     htmlStr = htmlStr.Replace(""", "")//去除异常的引号" " "

30 

31     htmlStr = htmlStr.Replace(""", "")

32 

33     return htmlStr.Trim()

34 

35 }

在网页中,HTML标签属于特殊字符,如果直接输入就会变成标记,这时就需要特殊字符对照表,将需要显示成特殊字符的转换出来即可。

比如:

<!DOCTYPE html>

<html lang="en">

<head>

    <meta charset="UTF-8">

    <title>知道用效果展示</title>

</head>

<body>

<h1>&lta&nbsphref="#"&gt哈哈哈&lt/a&gt</h1>

<h1><a href="#">哈哈哈</a> </h1>

</body>

</html>

效果图:

比如String s="<a href=/"www.baidu.com/"></a>"

具体是什么要打印出来才能帮你改~~~,这里值是举例"/"这个能让引号成为html的引号

ps:虽然这样表达消掉引号含义不对,但是对于你好理解