{
$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
"'<[\/\!]*?[^<>]*?>'si", // 去掉 HTML 标记
"'([\r\n])[\s]+'", // 去掉空白字符
"'&(quot|#34)'i", // 替换 HTML 实体
"'&(amp|#38)'i",
"'&(lt|#60)'i",
"'&(gt|#62)'i",
"'&(nbsp|#160)'i",
"'&(iexcl|#161)'i",
"'&(cent|#162)'i",
"'&(pound|#163)'i",
"'&(copy|#169)'i",
"'peihuo\.cn|peihuo\.mobi|div|\/'",
"'&#(\d+)'e") // 作为 PHP 代码运行
$replace = array ("",
"",
" ",//"\\1",
"\"",
"&",
"<",
">",
" ",
chr(161),
chr(162),
chr(163),
chr(169),
"",
"chr(\\1)")
return preg_replace ($search, $replace, $str)
}
很简单啊:<?php
//
第一步:你需要得到你的URL:
$URL=$_SERVER['HTTP_HOST']
.
$_SERVER['REQUEST_URI']
//第二步:把得到的URL后面的“.HTML”去掉:
$geturl=str_replace('.html','',$URL)
echo
$geturl
?>
但是,可但是:
你的这个页面应该是php的才对吧,如果是html的,就一定是应用了拟静态技术来重写URL,这样的话,上面的代码你也可以使用,如果是生成的
静态页面
,那么很不好意思,这个基本上不可行了。也无法达到你的意愿。
最近在项目中在需要输出浏览器中的源文件需要去掉html中的注释,在网上看了很多的方案,不过很多的答案都是一样的,并不能解决我的问题,于是就自己写正则表达式,也对正则有了更加深刻的理解。首先比较基础的是:
$a
=
'<!--ceshi-->ceshi'
$a
=
preg_replace('#<!--.*-->#'
,
''
,
$a)
var_dump($a)
上面的代码会输出ceshi。
但是如果是下面的字符串的话,就不能达到我们希望的效果了
$a
=
'<!--ceshi-->ceshi<!--ceshi-->'
$a
=
preg_replace('#<!--.*-->#'
,
''
,
$a)
var_dump($a)
于是我们就把匹配规则改成如下的格式
preg_replace('#<!--.*?-->#'
,
''
,
$a)
但是在html中如果有<!--[if
lt
IE
9]>ceshi<![endif]-->这样的代码的话是不能去掉的,所以我们需要改进匹配规则,改成以下的格式
preg_replace('#<!--[^\!\[]*?-->#'
,
''
,
$a)
又接着如果html中有<script><!--ceshi//--></script>的代码,我们又需要改一下我们的匹配规则了,改成了以下格式
preg_replace('#<!--[^\!\[]*?(?<!\/\/)-->#'
,
''
,
$a)
这样的话我基本上就去掉了我需要去掉的html的注释了!
以上就是小编为大家带来的php使用正则表达式去掉html中的注释方法全部内容了,希望大家多多支持脚本之家~