PHP如何去除HTML标签

html-css019

PHP如何去除HTML标签,第1张

function cut_tags_html($str)

{

$search = array ("'<script[^>]*?>.*?</script>'si",  // 去掉 javascript

                 "'<[\/\!]*?[^<>]*?>'si",           // 去掉 HTML 标记

                 "'([\r\n])[\s]+'",                 // 去掉空白字符

                 "'&(quot|#34)'i",                 // 替换 HTML 实体

                 "'&(amp|#38)'i",

                 "'&(lt|#60)'i",

                 "'&(gt|#62)'i",

                 "'&(nbsp|#160)'i",

                 "'&(iexcl|#161)'i",

                 "'&(cent|#162)'i",

                 "'&(pound|#163)'i",

                 "'&(copy|#169)'i",

                 "'peihuo\.cn|peihuo\.mobi|div|\/'",

                 "'&#(\d+)'e")                    // 作为 PHP 代码运行

$replace = array ("",

                  "",

                  " ",//"\\1",

                  "\"",

                  "&",

                  "<",

                  ">",

                  " ",

                  chr(161),

                  chr(162),

                  chr(163),

                  chr(169),

                   "",

                  "chr(\\1)")

  return  preg_replace ($search, $replace, $str)

}

很简单啊:

<?php

//

第一步:你需要得到你的URL:

$URL=$_SERVER['HTTP_HOST']

.

$_SERVER['REQUEST_URI']

//第二步:把得到的URL后面的“.HTML”去掉:

$geturl=str_replace('.html','',$URL)

echo

$geturl

?>

但是,可但是:

你的这个页面应该是php的才对吧,如果是html的,就一定是应用了拟静态技术来重写URL,这样的话,上面的代码你也可以使用,如果是生成的

静态页面

,那么很不好意思,这个基本上不可行了。也无法达到你的意愿。

最近在项目中在需要输出浏览器中的源文件需要去掉html中的注释,在网上看了很多的方案,不过很多的答案都是一样的,并不能解决我的问题,于是就自己写正则表达式,也对正则有了更加深刻的理解。

首先比较基础的是:

$a

=

'<!--ceshi-->ceshi'

$a

=

preg_replace('#<!--.*-->#'

,

''

,

$a)

var_dump($a)

上面的代码会输出ceshi。

但是如果是下面的字符串的话,就不能达到我们希望的效果了

$a

=

'<!--ceshi-->ceshi<!--ceshi-->'

$a

=

preg_replace('#<!--.*-->#'

,

''

,

$a)

var_dump($a)

于是我们就把匹配规则改成如下的格式

preg_replace('#<!--.*?-->#'

,

''

,

$a)

但是在html中如果有<!--[if

lt

IE

9]>ceshi<![endif]-->这样的代码的话是不能去掉的,所以我们需要改进匹配规则,改成以下的格式

preg_replace('#<!--[^\!\[]*?-->#'

,

''

,

$a)

又接着如果html中有<script><!--ceshi//--></script>的代码,我们又需要改一下我们的匹配规则了,改成了以下格式

preg_replace('#<!--[^\!\[]*?(?<!\/\/)-->#'

,

''

,

$a)

这样的话我基本上就去掉了我需要去掉的html的注释了!

以上就是小编为大家带来的php使用正则表达式去掉html中的注释方法全部内容了,希望大家多多支持脚本之家~