JAVA中的类是具备某些共同特征的实体的集合,它是一种抽象的概念,用程序设计的语言来说,类是一种抽象的数据类型,它是对所具有相同特征实体的抽象。所谓对象就是真实世界中的实体,对象与实体是一一对应的,也就是说现实世界中每一个实体都是一个对象,对象是一种具体的概念。JAVA类打开网页有以下方法:
1、java.net.URI uri = new java.net.URI("http://www.baidu.com")
java.awt.Desktop.getDesktop().browse(uri)
2、Runtime.getRuntime().exec("rundll32 url.dll,FileProtocolHandler http://www.baidu.com")
这两种方法是可以打开,不过只能在服务端打开,如果有另一台机器访问我的机器,执行上边的程序后,也会在我本机显示baidu的页面。
3、如果是让他自动打开可以用robot类模拟鼠标单击右键双击等动作,还可以模拟输入。
4、如果要在网页做复杂操作可以用swt做一个浏览器,可以控制他执行网站里的脚本,这个比较难点。
package test
import java.io.BufferedReader
import java.io.InputStreamReader
import java.net.HttpURLConnection
import java.net.URL
public class HttpTest {
private String u
private String encoding
public static void main(String[] args) throws Exception {
HttpTest client = new HttpTest("http://www.baidu.com/", "UTF-8")
client.run()
}
public HttpTest(String u, String encoding) {
this.u = u
this.encoding = encoding
}
public void run() throws Exception {
URL url = new URL(u)// 根据链接(字符串格式),生成一个URL对象
HttpURLConnection urlConnection = (HttpURLConnection) url
.openConnection()// 打开URL
BufferedReader reader = new BufferedReader(new InputStreamReader(
urlConnection.getInputStream(), encoding))// 得到输入流,即获得了网页的内容
String line// 读取输入流的数据,并显示
while ((line = reader.readLine()) != null) {
System.out.println(line)
}
}
}
根据具体问题类型,进行步骤拆解/原因原理分析/内容拓展等。
具体步骤如下:/导致这种情况的原因主要是……
通过Java代码实现对网页数据进行指定抓取方法步骤如下:1在工程中导入Jsoup.jar包
2获取网址url指定HTML或者文档指定的body
3获取网页中超链接的标题和链接
4获取指定博客文章的内容
5获取网页中超链接的标题和链接的结果