怎么去除文本中的HTML标签,我要显示成纯文本

html-css024

怎么去除文本中的HTML标签,我要显示成纯文本,第1张

工具/材料:Microsoft Office Word2016版,Word文档。

1、首先选中Word文档,双击打开。

2、其次在该界面中,选中带HTML标签的文本。

3、接着在该界面中,右键点击“剪切”选项。

4、其次在该界面中,右键点击“只粘贴文本”选项。

5、最后在该界面中,成功显示成纯文本。

</?font[^><]*>这个只却掉font标签的,保留除font以外的所有标签,如<img><p>等等. 同样的你需要去掉其他标签,只需要将里面的font换你要去掉的,就可以了.

</?[^/?(img)|(p)][^><]*>这个保留(这里我写的保留了img,p这两个标签)你指定的标签,其他的(包括font)全去掉, 如果你还有其他的标签想保留,直接在里面加一个 |(xxx)就行了,

</?[a-zA-Z]+[^><]*>这个就是我最上面写的那个,会去掉所有的标签,包括font .

</?[a-zA-Z]+[^><]*>这个表达式可以去掉所有HTML的标签

JAVA代码可以这样写:

public static String delTagsFContent(String content){

String patternTag = "</?[a-zA-Z]+[^><]*>"

String patternBlank = "(^\\s*)|(\\s*$)"

return content.replaceAll(patternTag, "").replaceAll(patternBlank, "")

}