有没办法asp读取网页上html的内容

html-css012

有没办法asp读取网页上html的内容,第1张

很简单在Dreamweaver中打开html文件另存为.asp的就可以了或者直接改文件名。如果.asp文件中没有动态脚本和html没有本质的区别html文件和asp文件的最大区别就在于一个是静态页面一个是动态页面,动态页面分客户端服务器端,需要数据库的支持;而静态页面只要你输入图片文字等信息就可以直接在浏览器运行。建议学习一下什么是动态页面。ASP是ActiveServerPage的缩写,意为“动态服务器页面”。ASP是微软公司开发的代替CGI脚本程序的一种应用,它可以与数据库和其它程序进行交互,是一种简单、方便的编程工具。ASP的网页文件的格式是.asp,现在常用于各种动态网站中。ASP是一种服务器端脚本编写环境,可以用来创建和运行动态网页或Web应用程序。ASP网页可以包含HTML标记、普通文本、脚本命令以及COM组件等。利用ASP可以向网页中添加交互式内容(如在线表单),也可以创建使用HTML网页作为用户界面的web应用程序。与HTML相比,ASP网页具有以下特点:asp(1)利用ASP可以实现突破静态网页的一些功能限制,实现动态网页技术;(2)ASP文件是包含在HTML代码所组成的文件中的,易于修改和测试;(3)服务器上的ASP解释程序会在服务器端执行ASP程序,并将结果以HTML格式传送到客户端浏览器上,因此使用各种浏览器都可以正常浏览ASP所产生的网页;(4)ASP提供了一些内置对象,使用这些对象可以使服务器端脚本功能更强。例如可以从web浏览器中获取用户通过HTML表单提交的信息,并在脚本中对这些信息进行处理,然后向web浏览器发送信息;(5)ASP可以使用服务器端ActiveX组件来执行各种各样的任务,例如存取数据库、发送Email或访问文件系统等。(6)由于服务器是将ASP程序执行的结果以HTML格式传回客户端浏览器,因此使用者不会看到ASP所编写的原始程序代码,可防止ASP程序代码被窃取。(7)方便连接ACCESS与SQL数据库.(8)开发需要有丰富的经验,否则会留出漏洞,让黑客利用进行注入攻击.ASP也不仅仅局限于与HTML结合制作WEB网站,而且还可以与XHTML和WML语言结合制作WAP手机网站。但是其原理也是一样的。[编辑本段]ASP-工作原理当在Web站点中融入ASP功能后,将发生以下事情:1、用户向浏览器地址栏输入网址,默认页面的扩展名是.asp。2、浏览器向服务器发出请求。3、服务器引擎开始运行ASP程序。4、ASP文件按照从上到下的顺序开始处理,执行脚本命令,执行HTML页面内容。5、页面信息发送到浏览器。

index.asp,asp代码部分

if Request.QueryString("id")="" then

    response.write"<SCRIPT language=JavaScript>alert('ID错误!')"

    response.write"javascript:history.go(-1)</SCRIPT>"

else

    id= Request.QueryString("id")

    url = "http://www.ceshi.com/"&id&".html"

    dim a,b

    a=GetPage(url)

    b=GetContent(a,"url=""","html",0)&"html"

    'urlb = "http://www.ceshi.com/2015/06/28/123456.html"

    '要求:21.html中格式为url="XXX.XX"前缀url=,后面是双引号

    '还是有些不明白,生成html的时候地址直接写进数据库不好么,

    '文章表对应ID 存储html地址这样

    urlb=b

end if

ComStrindex = GetPage(urlb)

Set Re=new RegExp

Re.Global = True

listbody = GetContent(ComStrindex,"<!DOCTYPE","</html>",1)

set reg = new regexp

reg.global = true

reg.ignorecase = true

reg.pattern = "包含内容:""(.*?)"""

set baohan = reg.execute(listbody)

你的这个需求不是调用,而且是远程读取(采集),现在网上很流行的小偷程序都是这样的。ASP要达到这个目地,则不得不用XMLHTTP这个对像了。用XMLHTTP远程读取整个目标网页内容到服务器,得到的将是HTML源代码(跟查看源代码看到的一样),然后利用ASP的正则表达式来分析得到的内容,找出你想要的内容,输出到你的网站。具体比较复杂,因为还有编码的问题,正则分析的问题,你可以参考网上的 小偷程序 ASP版。如果目标网站服务器设计了防采集程序,那么你是读取不到内容的。毕竟这是跨域的行为。