浏览器是怎么把html文档解析成DOM结构的

2023-03-04 02:19:02html-css028

浏览器是怎么把html文档解析成DOM结构的,第1张

浏览器解析html的过程如下：

HTML解析器的工作是解析HTML标记到解析树

1)HTML语法定义

HTML的词汇与句法定义在w3c组织创建的规范中。当前版本是HTML4，HTML5的工作正在进行中。

2)不是上下文无关语法

在对解析器的介绍中看到，语法可以用类似BNF的格式规范地定义。不幸的是所有常规解析器的讨论都不适用于HTML（我提及它们并不是为了娱乐，它们可以用于解析CSS和JavaScript）。HTML无法用解析器所需的上下文无关的语法来定义。过去HTML格式规范由DTD (Document Type Definition)来定义，但它不是一个上下文无关语法。

HTML与XML相当接近。XML有许多可用的解析器。HTML还有一个XML变种叫XHTML，那么它们主要区别在哪里呢？区别在于HTML应用更加”宽容”，它容许你漏掉一些开始或结束标签等。它整个是一个“软”句法，不像XML那样严格死板。总的来说这一看似细微的差别造成了两个不同的世界。一方面这使得HTML很流行，因为它包容你的错误，使网页作者的生活变得轻松。另一方面，它使编写语法格式变得困难。所以综合来说，HTML解析并不简单，现成的上下文相关解析器搞不定，XML解析器也不行。

3)HTML DTD

HTML的定义使用DTD文件。这种格式用来定义SGML族语言，它包含对所有允许的元素的定义，包括它们的属性和层级关系。如我们前面所说，HTML DTD构不成上下文无关语法。

DTD有几种不同类型。严格模式完全尊守规范，但其它模式为了向前兼容可能包含对早期浏览器所用标签的支持。当前的严格模式DTD：http://www.w3.org/TR/html4/strict.dtd

4)DOM

解析器输出的树是由DOM元素和属性节点组成的。DOM的全称为：Document Object Model。它是HTML文档的对象化描述，也是HTML元素与外界（如Javascript）的接口。

DOM与标签有着几乎一一对应的关系，如下：

<html>

<body>

<p>hello world</p>

</body>

</html>

解析文本形式的HTML并取值可以参考如下代码：

String page="

<!DOCTYPEhtml>

<html>

<head>

<title>Hello World</title>

</head>

<body>

<div id="div">Hello World</div>

</body>

</html>"

String str=Jsoup.parse(page).select("div#div").text()

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：java是什么东西？

# 下一篇：css怎么让一张图片适应任何屏幕大小的电脑平铺?

给您推荐相同类型的内容：

CSS里面怎么设置字体透明度
&ltdiv style="height: 60background-color: redfilter:alpha(opacity=20)"&gtmeizz&ltdiv&gtalpha
如何一键轻松退出所有应用程序？快看！
1 首先在桌面空白处点击鼠标右键，创建“快捷方式”。2 在“请键入对象的位置”中直接复制下面的内容粘贴进去：taskkill F FI "USERNAME eq 用户名" FI "IMAGENAME ne
下列哪个css属性能够设置文本加粗
fontweight可以给css属性设置文本加粗。css中可使用fontweight属性设置文字加粗，只需要给元素添加fontweightboldbolder样式即可，值bold定义粗体字符，bolder定义更粗的字符。还可设置值为700、
查看电脑配置指令有哪些
查看电脑配置指令有哪些查看电脑配置信息命令大全：查看电脑配置命令：dxdiag 查看系统属性命令：sysdm.cpl 查看系统信息命令：msinfo32 查看当前ip命令: 在cmd里输入ipconfigall
bat是什么
BAT，B=百度、A=阿里巴巴、T=腾讯，是中国互联网公司百度公司（Baidu）、阿里巴巴集团（Alibaba）、腾讯公司（Tencent）三大互联网公司首字母的缩写。BAT已经成为中国最大的三家互联网公司。中国互联网发展了20年，现在形
html文档声明的三种级别是哪三种
HTML文档声明，目前有2种最常用，而非三种级别，如下：1、XHTML1.1文档严格定义类型，等同于XHTML1.0文档过渡定义类型&lt!DOCTYPE HTML PUBLIC "-W3CDTD HTML 4.
1000元左右能买什么样的电脑？
一千多块钱能买什么笔记本？嗯……这都已经2022年，居然还有人想用一千块块钱买一个好点的笔记本。不过说归说，笔者我呢，还真就找到了，不过这一类的笔记本大都只能用来上个网课，简单的办公，玩玩4399小游戏之类的，太难得，过于复杂则基本无法胜任
css居中的几种方式
1.横向居中（1）方法一 position: fixed * 居中对齐begin * left: 50% * 兼容老版本的方法 * -webkit-transform: translateX(-50%)
电脑主机怎么关电脑主机关机的方法
1、鼠标点击电脑桌面左下角“Windows”图标，在弹出的选择项中点击“电源”选项，接着点击“关机”选项，这时电脑就会进入到关机过程，这种方法对电脑最没有损害。2、在电脑的主机箱上会有电源按键的，按下电脑的电源键就可以实现关闭电脑了，不过这
电脑的水冷什么牌子的好一些，别太贵
为了帮助网友解决“电脑的水冷什么牌子的好一些，别太贵”相关的问题，布客网通过互联网对“电脑的水冷什么牌子的好一些，别太贵”相关的解决方案进行了整理,用户详细问题包括:电脑的水冷什么牌子的好一些，别太贵，具体解决方案如下：用户提供的回答1：低
jq css怎么实现元素背景颜色闪烁几下
(1)如某个标签的id，利用jquery获取该id，即$(id) (2)利用jquery中的方法css改变背景 (3)$(id).css("background":"url("imagesa.gif
台式电脑的声卡在哪？
1、台式的声卡是集成的主板上面的一般在主板的左下角有一个正方形的很多角的，如图所示：2、台式电脑的显卡如果是独立显卡在主板的PCI-E的插槽上，那个插槽大体外形和内存的插条有一点像，而且位置会靠近机箱的背面，因为显卡插好之后显示器的一条
玩galgame需要掌握哪一类计算机技术，大家有什么好的推荐？
相较于动画，我个人更喜欢视觉小说这一形式，而许多gal的剧情都很优秀，我可以把它们当做带有图像、配音和配乐的小说来读。至于有没有女的、有多少女的，由于我本人就是女孩子，所以这对我来说倒是无所谓甚至连感情线都可有可无。而在玩乙女游戏或看女的向
js实现选区截图
具体步骤：安装canvas2image后运行的时候，如果报错在node_modulescanvas2imagecanvas2image.js后面加上可以使用html2canvas.js，生成的数据是data:imagejp
ASP调用html内容
你的这个需求不是调用，而且是远程读取（采集），现在网上很流行的小偷程序都是这样的。ASP要达到这个目地，则不得不用XMLHTTP这个对像了。用XMLHTTP远程读取整个目标网页内容到服务器，得到的将是HTML源代码（跟查看源代码看到的一样）
请问各位,这是一段导航菜单的js代码，哪位好心人替我解释指点下，谢谢哈
参考答案:一个熬字益人生莫言说，回老家与侄子们交谈，他们竟然不明白“站着说话不腰疼”的含义，因为他们从没有弯腰割过麦子。刘震云说，他姥姥割麦比别人快，诀窍就是弯下腰不直起来，直腰次数越多腰越疼。正是“干活原本无技巧，能忍自然效率高。人生态
电脑主板坏了会出现什么现象
电脑主板坏了的症状有：1、电脑开机的时候，屏幕显示蓝屏。2、电脑开机的时候，直接死机。3、如果鼠标、键盘、声卡、显卡集成的，会产生对应的没有声音、图像。4、开机后，无法完成自检无法进入BIOS设置。5.电脑频繁死机，进行CMOS设置时也会出
jsmm是什么的简称
JSMM的全称：Japanese Society for Medical Mycology (est. 1956)| 中文意思：───日本医学真菌学会(est。 1956)JSMM的全称：Joint Supply Management Mo
怎样禁止复制电脑文件
使用文档透明加密功能就可以对电脑上常用的办公文档类型进行加密，域之盾软件的透明加密功能能够对办公所用的文档和表格等进行加密，也可以对图纸设计类和图片设计类进行加密保护，针对不同部门设置不同密钥，可以防止员工随意流传文件行为，另外加密文件只能
为什么电脑连接显示屏没反应怎么办
1. 为什么我的电脑连接显示器没有反应呢你怎么断定你的显示器是好的呢，你的VGA连接线是接上的话，显示器是黑屏的？还是显示NO sing（无信号）？1，主机正常判断，开机后看键盘灯，按7上面的那个MUn lock键，能随着你的按松
css怎么让一张图片适应任何屏幕大小的电脑平铺?
下面是图片不失真但不保证是否完全铺满（留有空隙或者超出屏幕）的css代码：1、横向铺满，纵向留有空隙或超出屏幕：body {background:url(图片路径) no-repeat centerbackground-size:100%
电脑老是自动启动是什么原因
1.显卡是不是超频了？降低频率2.机器整体散热不够，加强散热3.内存重新插拔4.硬盘保护5.系统垃圾多，建议用360安全卫士清理注册表:regeditmsconfig6.减少开机滚动条时间HKEY_LOCAL_MACHINESYSTEM
笔记本电脑可以配无线键盘和鼠标吗
可以。只要把插在无线鼠标上的USB插头的无线接收器拔下，插入笔记本电脑的USB插口上，并在无线鼠标和无线键盘上装上电池后即可使用。使用无线鼠标和无线键盘后，可以离开笔记本电脑10米之内的距离内进行操作，比有
html css 分别代表什么意思
HTML（超文本标记语言）和CSS（级联样式表）是用于构建Web页面的两项核心技术。HTML为各种设备提供页面的结构，为CSS提供（视觉和听觉的）布局。与图形和脚本一起，HTML和CSS是构建网页和 Web应用程序的基础。HTML称为超文
Java中定义泛型<T>时，怎么获得泛型的类型
T.getClass()或者T.class都是非法的，因为T是泛型变量。由于一个类的类型是什么是在编译期处理的，故不能在运行时直接在Base里得到T的实际类型。有一种变通的实现方式：import java.lang.reflect.Arra
js控制文本域实现是否编辑功能切换
1、使用jQuery的attr()方法设置input的编辑状态取消不可编辑使用$("input").removeAttr("disabled")让input变为不可编辑状态$("i
购买的电脑的账务处理及如何计提折旧
借：固定资产 6000贷：银行存款 6000借：营业费用（管理费用）——折旧费（6000-6000*0.03）312贷：累计折旧（6000-6000*0.03）312例如：5000元，残值率3%，折旧年限3年，按月计提折旧。
如何在HTMl网页中插入百度地图
1、登录百度地图api，地址：http:api.map.baidu.comlbsapicreatmapindex.html2、设置你的地理位置，以北京大学为例子如图：3、简单设置下地图功能，也可以不设置。地图的宽度和高度根据网页空
编程用的笔记本电脑推荐
适合程序员编程用的笔记本电脑首先应该满足小巧轻便这个需求，然后才是性能因素，一个标准的程序员必定能够随时随地改BUG，所以可以优先考虑苹果MacBook Pro，由于其 MacOS 就是Linux内核，做开发无疑是最佳的选择。当然还有非常多
python 如何实现反转倒序
#1.字符串、列表、元组均可用此方法 (使用切片的方法) 不修改元素原有内容,将输出进行赋值#1.1 字符串s='nihao' s1=s[::-1]#1.2 列表lin=["a","b&qu

推荐阅读

热门文章

最新发布

标签列表

浏览器是怎么把html文档解析成DOM结构的

给您推荐相同类型的内容：