如何去除html标签得到纯文本内容

如何去除html标签得到纯文本内容

在网页刚流行起来的时候,提取html中的文本有一个简单的方法,就是将html文本(包含标记)中的所有以“&lt”符号开头到以“&gt”符号之间的内容去掉即可。但对于现在复杂的网页而言,用这种方法提取出来的文本会有大量的空格、
html-css330