php正则表达式删除html标签

html-css050

php正则表达式删除html标签,第1张

$str='<p align="center"><img src="1.jpg" width="50" height="50"/></p><p>第一段</p><p align="center"><img src="2.jpg" width="50" height="50"/></p><p>第二段</p>'

preg_match_all('/<p>(.*?)<\/p>/', $str, $matches)

print_r($matches)

最近在项目中在需要输出浏览器中的源文件需要去掉html中的注释,在网上看了很多的方案,不过很多的答案都是一样的,并不能解决我的问题,于是就自己写正则表达式,也对正则有了更加深刻的理解。

首先比较基础的是:

$a

=

'<!--ceshi-->ceshi'

$a

=

preg_replace('#<!--.*-->#'

,

''

,

$a)

var_dump($a)

上面的代码会输出ceshi。

但是如果是下面的字符串的话,就不能达到我们希望的效果了

$a

=

'<!--ceshi-->ceshi<!--ceshi-->'

$a

=

preg_replace('#<!--.*-->#'

,

''

,

$a)

var_dump($a)

于是我们就把匹配规则改成如下的格式

preg_replace('#<!--.*?-->#'

,

''

,

$a)

但是在html中如果有<!--[if

lt

IE

9]>ceshi<![endif]-->这样的代码的话是不能去掉的,所以我们需要改进匹配规则,改成以下的格式

preg_replace('#<!--[^\!\[]*?-->#'

,

''

,

$a)

又接着如果html中有<script><!--ceshi//--></script>的代码,我们又需要改一下我们的匹配规则了,改成了以下格式

preg_replace('#<!--[^\!\[]*?(?<!\/\/)-->#'

,

''

,

$a)

这样的话我基本上就去掉了我需要去掉的html的注释了!

以上就是小编为大家带来的php使用正则表达式去掉html中的注释方法全部内容了,希望大家多多支持脚本之家~

可以使用strip_tags函数

<?php

$rr = strip_tags($str,'<img><a><p><br>')

echo $rr

?>