java程序怎么读取html网页?

html-css019

java程序怎么读取html网页?,第1张

步骤:

一、使用java.net包下的URL类,可以将一个网页(链接)封装成一个URL对象。

二、URL对象有一个openStream()方法,使用该方法可以获取该网页的输入流,我们可以通过读取输入流的方式获得网页的内容,并通过输出流写入HTML文件中。

补充:

步骤:

1.通过URL对象的openStream()方法获得网页的字节输入流 。

2.为字节输入流加缓冲 。

3. 创建字节输出流对象 。

4. 为字节输出流加缓冲 。

5. 读取数据,并写入HTML文件 。

这个案例演示的是:在 HTML 输出流中使用document.write.

按 F12 在控制台输入

document.write("<h1>这是一个标题</h1>")

你页面上的内容就会被覆盖掉

1、首先我们来创建一个类名为OutServlet的类,接下来让它继承HttpServelt类,然后重写doGet和doPost的方法。

2、然后我们在web.xml配置OutServlet的相关的信息,比如类的全路径和访问路径。

3、接下来我们在OutServlet的doGet方法中利用response对象调用getOutputStream()获取一个OutputStream的对象。然后我们来调用OutpuStream对象的write()方法输出一个字节数组,这个字节数组由中文字符串转化得来。

4、利用OutputStream这种方式输出中文有可能产生乱码。注意是有可能,而不是一定产生乱码。

5、为了让它实现无论用什么浏览器都不会乱码,我们来设置浏览器打开这个文件的编码方式;然后设置文件的编码方式。让两者的编码方式一致,它就不会乱码了。