最新发布

# 2023-02-17
css如何设置方形单选按
1、新建一个html文件，命名为test.html，用于讲解。2、在test.html文件中，使用button标签创建一个按钮。3、在test.html文件中，设置button标签的class属性为mybtn。4、在css标签内，通过cla
# 2023-02-17
css+less变量
1.css变量的使用 2.less变量使用：变量+混合+嵌套+循环 webstorm配置less：通过命令npm install -g less先安装less html内容如下： less内容如下：可以的，在选择器方面，le
# 2023-02-17
CSS中font是什么意思？
CSS中font是设置字体属性的。font在css的作用就是在一个声明中设置所有字体属性：举例说明：&lthtml&gt&lthead&gt&ltstyle type="text
# 2023-02-17
CSS里的定位主要有几种方法？
定位方案有四种：静态定位、相对定位、绝对定位和固定定位。你可以使用CSS 3中的「position」属性来决定要使用的定位方式。在这四种方案中，静态和相对定位不会影响整个文档的布局，而绝对和固定定位会与文档分开，因此页面不会为这两种类型的
# 2023-02-17
html5新增标签有哪些
html5新增标签如下：1、结构性标记结构性标记主要用来对页面结构进行划分，就像在设计网页时将页面分为导航、内容部分、页脚等，确保HTML文档的完整性。2、多媒体标记多媒体标记主要解决了以往通过Flash等进行视频的一些展示，新增的标记
# 2023-02-17
怎么制作HTML网页，并通过邮箱发送?
1，使用桌面邮件程序如outlook，foxmail可以选择html模板，发送的邮件均会是html格式的。 2，使用gmail，126等邮箱其本生提供文本格式化，而格式化即使为文字添加代码只是这些代码你看不到而已，你所看到的是代码执行以后的
# 2023-02-17
HTML基础知识(18)
1、call和apply二者都可以改变当前的this，区别在于apply方法要将参数放入数组中再传参2、函数的继承 function Fclass(name, age){ this.name = name
# 2023-02-17
css如何给图片加一个蒙版遮罩
1．首先，看一下HTML，一个img图像控件和一个带有样式的div，其中包含文本。这个就是蒙版遮罩层。2．然后，查看样式定义。先检查图像容器和图像样式，如图所示。其中要注意的是img_container样式里定义了position:rela
# 2023-02-17
css 兼容性问题
1.H5网页touch滑动的时候在苹果手机上出现不流畅的问题-webkit-overflow-scrolling 用来控制元素在移动设备上是否使用滚动回弹效果. 解决办法：给所有网页添加如下样式说明： -webki
# 2023-02-17
html下拉列表怎么做？
&ltselect name="yourName" id="yourId"&gt&ltoption value="1"&gt1&ltop

如何使用xpath表达式解析HTML和XML文档

2023-02-27 23:53:01html-css010

如何使用xpath表达式解析HTML和XML文档,第1张

看下面一些例子：

1)获取子节点：getchildren()等价于child::*

>>>doc.getchildren()

2)获取当前节点："."等价于self::node()

>>>doc.xpath(".")

>>>doc.xpath("self::node()")

3)获取父节点：".."等价于parent::node()

>>>doc.head.xpath("..")

>>>doc.head.xpath("parent::node()")

4）ancestor轴和descendant轴

分别代表当前元素所有祖先元素、所有后代元素，比如：

>>>meta.xpath('ancestor::*')

>>>meta.xpath('ancestor::head')

>>>doc.xpath('descendant::table')

>>>doc.xpath('descendant::table[@id="tcdatafields"]')

>>>doc.xpath('//table[@id="tcdatafields"]')

5）ancestor-or-self和descendant-or-self轴

分别表示当前元素或其所有祖先元素、当前元素或其所有后代元素，比如：

>>>meta.xpath('ancestor-or-self::*')

,,]

6）child和parent轴

分别表示当前元素所有子元素、父元素：

>>>doc.xpath('child::head')

>>>head.xpath('child::meta[1]')

>>>head.xpath('child::meta[position()<3]')

7）attribute轴

表示当前元素的所有属性，例如下面是meta元素的name和content两个属性以及取值：

>>>meta.items()

[('name','googlebot'),('content','index,follow')]

获取所有属性取值：

>>>meta.xpath('attribute::*')

['googlebot','index,follow']

获取name属性的取值：

>>>meta.xpath('attribute::name')

['googlebot']

8）following和preceding

分别表示当前元素的所有后继元素、前置元素，比如：

>>>meta.xpath('following::*')

>>>meta.xpath('preceding::*')

9）following-sibling和preceding-sibling轴

分别表示当前元素的所有平级后继元素、平级前置元素，比如：

>>>meta.xpath('preceding-sibling::*')

>>>meta.xpath('following-sibling::*')

10）self轴

表示当前元素自身

>>>doc.xpath("self::*")

使用谓词(predicates)

谓词就是step中使用中括号[...]定义的那部分，使用谓词能实现精确查找，看下面的例子：

>>>doc.xpath('/html/head/meta')

,,,,,,]

1)位置谓词

>>>doc.xpath('/html/head/meta[1]')

>>>doc.xpath('/html/head/meta[2]')

>>>doc.xpath('/html/head/meta[last()]')

>>>doc.xpath('/html/head/meta[last()-1]')

>>>doc.xpath('/html/head/meta[position()<3]')

注：这里使用了last()和position()两个函数，xpath还支持更多的函数，结合这些函数可以获得非常强大的处理能力。

2)属性谓词

含有属性name的meta元素：

>>>doc.xpath('/html/head/meta[@name]')

,,,]

含有属性name而且其取值为robots的meta元素：

含有任意属性的meta元素：

>>>doc.xpath('/html/head/meta[@*]')

3)函数谓词

xpath内置很多函数，灵活使用这些函数，可以极大提升查找效率，比如：

-使用text()函数

>>>doc.xpath('//td[text()="2017-03-21"]')

-使用contains函数

>>>[td.textfortdindoc.xpath('//td[contains(text(),"2017-03-2")]')]

['2017-03-29','2017-03-28','2017-03-27','2017-03-24','2017-03-23','2017-03-22','2017-03-21','2017-03-20']

-使用starts-with函数

>>>[td.textfortdindoc.xpath('//td[starts-with(text(),"2017-02-2")]')]

['2017-02-28','2017-02-27','2017-02-24','2017-02-23','2017-02-22','2017-02-21','2017-02-20']

>>>[td.textfortdindoc.xpath('//td[text()>21.0andtext()<23.0]')]

['21.02']

>>>[td.textfortdindoc.xpath('//td[text()<-2.5ortext()>21.0]')]

['21.02','-2.64']

通配符

xpath也支持通配符"*"，其中'*"可以匹配任何标签元素，"@*"可以匹配任何元素属性，node()可以匹配任何节点：

>>>head.xpath('./*')

,,,,,,,,,]

>>>head.xpath('./meta[@*]')

>>>head.xpath('./node()')

html（Hypertext Markup Language）：

超文本标记语言，网页中的基本元素，是用于描述网页文档的一种标记语言。

XML（Extensible Markup Language）：

即可扩展标记语言，它与HTML一样都是一种标记语言，只不过这个可以自定义，功能强，更灵活。

http(HTTP，HyperText Transfer Protocol)：

超文本传输协议，是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须遵守这个标准。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。

SOAP：

简单对象访问协议，简单对象访问协议（SOAP）是一种轻量的、简单的、基于 XML 的协议，它被设计成在 WEB 上交换结构化的和固化的信息。 SOAP 可以和现存的许多因特网协议和格式结合使用，包括超文本传输协议（ HTTP），简单邮件传输协议（SMTP），多用途网际邮件扩充协议（MIME）。它还支持从消息系统到远程过程调用（RPC）等大量的应用程序。

XSLT（Extensible Stylesheet Language Transformations）：

扩展样式表转换语言的简称，这是一种对XML文档进行转化的语言，XSLT中的T代表英语中的“转换”（transformation）。

XPath：

是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：Go语言基础语法（一）

# 下一篇：消息队列概念