最新发布

# 2023-02-09
harmonyos是什么意思
harmonyos即鸿蒙系统的意思，正确写法为harmony os。harmony os鸿蒙系统是华为公司在2019年8月9日于东莞举行华为开发者大会（HDC.2019）上正式发布的操作系统。鸿蒙系统面向全场景的分布式操作，将人、设备、
# 2023-02-09
华为HarmonyOS与安卓对比：鸿蒙系统的强大不止于此
自从HarmonyOS 2上线后，HarmonyOS优越的性能表现让大家眼前一亮，我认为该系统最大的优点就是可在后台打开多个大型游戏且能保持游戏不中断，即后台保活率高。据测评媒体@小白测评的实验数据显示搭载H
# 2023-02-09
鸿蒙OS2.0九大新功能，详细玩机技巧
鸿蒙OS适配后，相比EMUI新增了九大功能！赶快保存或者手机搜索玩机技巧。一、HarmonyOs 桌面提供了服务卡片、大文件夹与小艺建议,让操作更便捷、桌面更美观。服务卡片:无需打开应用,可快速预览应用信息或使用常用功能。将不同
# 2023-02-09
华为怎么取消harmony系统
harmonyOS系统是可以退出的。HarmonyOS版本可以通过华为手机助手回退到EMUI 11.0官方稳定版本。注意事项：1. 请确保当前使用的是华为官方版本，且为HarmonyOS版本，并且未进行任何非官方版本
# 2023-02-09
极客简报｜华为跌倒苹果吃饱；HarmonyOS 用户破亿
本周苹果召开新品发布会，iPhone 13 系列、iPad 9、iPad mini 6 以及 Apple Watch Series 7 正式亮相，大多数产品已于本周开卖，最快 9 月 24 日即可到手。极客之选
# 2023-02-09
华为三款新机上市：预装HarmonyOS系统，但不支持5G，3699元起
大家都知道现在的手机市场主要还以5G手机为主，但深受芯片限制的华为也不得不再把4G手机拿出来“炒冷饭”。今日零点，华为多款4G新机正式开售，分别是华为Mate40 Pro 4G、Mate40E 4G以及nova8 Pro 4G。在5G
# 2023-02-09
HarmonyOS赋能HUAWEI WATCH 3系列：隐私安全再升级
当前智能可穿戴设备已经慢慢渗透到我们的生活当中，有更多人愿意借助可穿戴设备来监测身体的各项数据与指标，从而更好的保护自己的身体。而华为作为可穿戴设备的头部厂商，凭借优质的硬件，丰富的软件及生态服务，受到了广大消费者的青睐。根据IDC《中国
# 2023-02-09
鸿蒙系统网页捷径怎么关闭
在华为浏览器设置中进行关闭。具体步骤：1.打开华为浏览器点击右下角更多。2.打开按键设置，选择主页设置。3.选择自定义主页，接下来选择自定义网址，就可以让捷径这个功能消失了。首先，您需要了解升级Harmony OS前的准备工作：1.升级前，
# 2023-02-09
HarmonyOS技术特性
最近,随着华为的一批电子设备升级鸿蒙系统,鸿蒙系统的热度也逐渐升高。这里分享一下鸿蒙系统的定位及底层特性,让人们比较深入的认识一下鸿蒙系统。 HarmonyOS是一款面向万物互联时代的、全新的分布式操作系统。
# 2023-02-09
鸿蒙抄袭安卓？看这一篇就够了
01什么是 AOSP ？很多人都说鸿蒙是 AOSP 套壳，那么我们首先得明白什么是 AOSP？ AOSP 是"Android Open Source Project&

java获取URL

2023-03-05 09:54:02Python013

java获取URL,第1张

import java.io.BufferedReader

import java.io.IOException

import java.io.InputStreamReader

import java.net.MalformedURLException

import java.net.URL

import java.util.ArrayList

import java.util.List

public class GetLinks {

private String webSource

private String url

public GetLinks(String url) throws MalformedURLException, IOException {

this.url = Complete(url)

webSource = getWebCon(this.url)

}

private String getWebCon(String strURL) throws MalformedURLException,

IOException {

StringBuffer sb = new StringBuffer()

java.net.URL url = new java.net.URL(strURL)

BufferedReader in = new BufferedReader(new InputStreamReader(url

.openStream()))

String line

while ((line = in.readLine()) != null) {

sb.append(line)

}

in.close()

return sb.toString()

}

private String Complete(String link)throws MalformedURLException{

URL url1 = new URL(link)

URL url2 = new URL(link+"/")

String handledUrl = link

try{

StringBuffer sb1 = new StringBuffer()

BufferedReader in1 = new BufferedReader(new InputStreamReader(url1

.openStream()))

String line1

while ((line1 = in1.readLine()) != null) {

sb1.append(line1)

}

in1.close()

StringBuffer sb2 = new StringBuffer()

BufferedReader in2 = new BufferedReader(new InputStreamReader(url2

.openStream()))

String line2

while ((line2 = in2.readLine()) != null) {

sb2.append(line2)

}

in1.close()

if(sb1.toString().equals(sb2.toString())){

handledUrl = link+"/"

}

}catch(Exception e){

handledUrl = link

}

return handledUrl

}

/**

* 处理链接的相对路径

* @param link 相对路径或绝对路径

* @return 绝对路径

*/

private String urlHandler(String link) {

if (link == null)

return null

link = link.trim()

if (link.toLowerCase().startsWith("http://")

|| link.toLowerCase().startsWith("https://")) {

return link

}

String pare = url.trim()

if (!link.startsWith("/")) {

if (pare.endsWith("/")) {

return pare + link

}

if (url.lastIndexOf("/") == url.indexOf("//") + 1 || url.lastIndexOf("/") == url.indexOf("//") + 2) {

return pare + "/" + link

} else {

int lastSeparatorIndex = url.lastIndexOf("/")

return url.substring(0, lastSeparatorIndex + 1) + link

}

}else{

if (url.lastIndexOf("/") == url.indexOf("//") + 1 || url.lastIndexOf("/") == url.indexOf("//") + 2) {

return pare + link

}else{

return url.substring(0,url.indexOf("/", url.indexOf("//")+3)) + link

}

}

}

public List<String>getAnchorTagUrls() {

if (webSource == null) {

System.out.println("没有网页源代码")

return null

}

ArrayList<String>list = new ArrayList<String>()

int index = 0

while (index != -1) {

index = webSource.toLowerCase().indexOf("<a ", index)

if (index != -1) {

int end = webSource.indexOf(">", index)

String str = webSource.substring(index, end == -1 ? webSource

.length() : end)

str = str.replaceAll("\\s*=\\s*", "=")

if (str.toLowerCase().matches("^<a.*href\\s*=\\s*[\'|\"]?.*")) {// "^<a\\s+\\w*\\s*href\\s*=\\s*[\'|\"]?.*"

int hrefIndex = str.toLowerCase().indexOf("href=")

int leadingQuotesIndex = -1

if ((leadingQuotesIndex = str.indexOf("\"", hrefIndex

+ "href=".length())) != -1) { // 形如<a

// href=".....">

int TrailingQuotesIndex = str.indexOf("\"",

leadingQuotesIndex + 1)

TrailingQuotesIndex = TrailingQuotesIndex == -1 ? str

.length() : TrailingQuotesIndex

str = str.substring(leadingQuotesIndex + 1,

TrailingQuotesIndex)

str = urlHandler(str)

list.add(str)

System.out.println(str)

index += "<a ".length()

continue

}

if ((leadingQuotesIndex = str.indexOf("\'", hrefIndex

+ "href=".length())) != -1) { // 形如<a

// href='.....'>

int TrailingQuotesIndex = str.indexOf("\'",

leadingQuotesIndex + 1)

TrailingQuotesIndex = TrailingQuotesIndex == -1 ? str

.length() : TrailingQuotesIndex

str = str.substring(leadingQuotesIndex + 1,

TrailingQuotesIndex)

str = urlHandler(str)

System.out.println(str)

list.add(str)

index += "<a ".length()

continue

}

int whitespaceIndex = str.indexOf(" ", hrefIndex

+ "href=".length())// 形如<a href=

// http://www.baidu.com >

whitespaceIndex = whitespaceIndex == -1 ? str.length()

: whitespaceIndex

str = str.substring(hrefIndex + "href=".length(),

whitespaceIndex)

str = urlHandler(str)

list.add(str)

System.out.println(str)

}

index += "<a ".length()

}

}

return list

}

public static void main(String[] args) throws Exception {

GetLinks gl = new GetLinks("http://www.baidu.com")

List<String>list = gl.getAnchorTagUrls()

for(String str:list) {

System.out.println(str)

}

}

}

什么叫自动获取？

如果想用java访问 http连接的话

1.创建连接：

URL url = new URL("http://www.baidu.com")

2.打开连接，获取连接输入流。

InputStream in = url.openConnection().getInputStream()

3.解析流。

System.out.println(IOUtils.toString(in))//输出访问地址内容。。

方法1：正则 (http://)或者（https://）开头往后面匹配三个点，不会的话百度一波。然后把最后的点去掉就可以得到域名方法2：将URL字符串转换为charArray遍历对.(点)的次数进行记数第三次当前返回下标用SubString切割字符串获取域名

的话形如字符串路径绝对路径

# 上一篇：html css怎么让文字在页面底部居中

# 下一篇：CSS字体与文本样式详解