最新发布

# 2023-02-17
css是什么意思
css指的是层叠样式表。css是一种用来表现HTML或XML等文件样式的计算机语言，是描述标记语言页面格式的标准。CSS使开发人员能够分离内容和可视元素，以实现更好的页面控制和灵活性。CSS不仅可以静态地修饰网页，还可以配合各种脚本语言动
# 2023-02-17
火狐下css滤镜效果怎么实现
滤镜效果filter的css样式属性是微软Internet Explorer特有的，未被W3C收入，故而在火狐浏览器下尚未提供支持。但是通过js编码可以部分实现一些滤镜效果，如透明等。随着浏览器的发展CSS的功能越来越强大，大多数的滤镜效果
# 2023-02-17
怎么让这个html超链接文字居中啊？
l让文字居中的方法：1、给文本所在标签加CSS属性值“text-align:center”；2、在行内标签或行内块级标签中加CSS属性值“text-align:left”。前端（vue）入门到精通课程：进入学习API 文档、设计、调试、自动
# 2023-02-17
html选择器有哪些
您好。HTML选择器有以下类型。第一种是标签选择器，也成为元素选择器。标签选择器的基本形式如下：tagName{property:value}，其中tagName是标签名称，property是css的属性。第二种是类选择器，类选择器用来为
# 2023-02-17
有关新手入门html5的书籍有哪些？
HTML5是万维网的核心语言、超文本标记语言(HTML)的第五次重大修改。HTML5 已经于2014年10月正式定稿。然而，大部分现代浏览器已经具备了某些HTML5支持。HTML5是web时代最前沿的技术，它特有canvas标签和多种选择的
# 2023-02-17
css 兼容性问题
1.H5网页touch滑动的时候在苹果手机上出现不流畅的问题-webkit-overflow-scrolling 用来控制元素在移动设备上是否使用滚动回弹效果. 解决办法：给所有网页添加如下样式说明： -webki
# 2023-02-17
记录：CSS3 模糊效果
最近在写活动页面遇到一个效果，在黑色透明蒙层后面的元素要有模糊，毛玻璃的效果，最初想到的就是 filter: blur(2px) ，直接在元素上使用，但是整个子元素都被模糊了，而且蒙层的背景并没有效果，经过百般搜索和尝试，发现还有一个属性
# 2023-02-17
html网页怎么微信打开
html网页在微信中打开的方法如下。1、手机登录微信，电脑打开微信，扫码登录。2、手机上点击文件传输助手。3、点击加号图标添加内容。4、图片，视频等文件直接发送，PDF，Word，音乐歌曲或其他非图片视频的文件，先添加到我的收藏，再发送。5
# 2023-02-17
html下拉列表怎么做？
&ltselect name="yourName" id="yourId"&gt&ltoption value="1"&gt1&ltop
# 2023-02-17
CSS中font是什么意思？
CSS中font是设置字体属性的。font在css的作用就是在一个声明中设置所有字体属性：举例说明：&lthtml&gt&lthead&gt&ltstyle type="text

如何使用xpath表达式解析HTML和XML文档

2023-03-03 22:46:01html-css029

如何使用xpath表达式解析HTML和XML文档,第1张

看下面一些例子：

1)获取子节点：getchildren()等价于child::*

>>>doc.getchildren()

2)获取当前节点："."等价于self::node()

>>>doc.xpath(".")

>>>doc.xpath("self::node()")

3)获取父节点：".."等价于parent::node()

>>>doc.head.xpath("..")

>>>doc.head.xpath("parent::node()")

4）ancestor轴和descendant轴

分别代表当前元素所有祖先元素、所有后代元素，比如：

>>>meta.xpath('ancestor::*')

>>>meta.xpath('ancestor::head')

>>>doc.xpath('descendant::table')

>>>doc.xpath('descendant::table[@id="tcdatafields"]')

>>>doc.xpath('//table[@id="tcdatafields"]')

5）ancestor-or-self和descendant-or-self轴

分别表示当前元素或其所有祖先元素、当前元素或其所有后代元素，比如：

>>>meta.xpath('ancestor-or-self::*')

,,]

6）child和parent轴

分别表示当前元素所有子元素、父元素：

>>>doc.xpath('child::head')

>>>head.xpath('child::meta[1]')

>>>head.xpath('child::meta[position()<3]')

7）attribute轴

表示当前元素的所有属性，例如下面是meta元素的name和content两个属性以及取值：

>>>meta.items()

[('name','googlebot'),('content','index,follow')]

获取所有属性取值：

>>>meta.xpath('attribute::*')

['googlebot','index,follow']

获取name属性的取值：

>>>meta.xpath('attribute::name')

['googlebot']

8）following和preceding

分别表示当前元素的所有后继元素、前置元素，比如：

>>>meta.xpath('following::*')

>>>meta.xpath('preceding::*')

9）following-sibling和preceding-sibling轴

分别表示当前元素的所有平级后继元素、平级前置元素，比如：

>>>meta.xpath('preceding-sibling::*')

>>>meta.xpath('following-sibling::*')

10）self轴

表示当前元素自身

>>>doc.xpath("self::*")

使用谓词(predicates)

谓词就是step中使用中括号[...]定义的那部分，使用谓词能实现精确查找，看下面的例子：

>>>doc.xpath('/html/head/meta')

,,,,,,]

1)位置谓词

>>>doc.xpath('/html/head/meta[1]')

>>>doc.xpath('/html/head/meta[2]')

>>>doc.xpath('/html/head/meta[last()]')

>>>doc.xpath('/html/head/meta[last()-1]')

>>>doc.xpath('/html/head/meta[position()<3]')

注：这里使用了last()和position()两个函数，xpath还支持更多的函数，结合这些函数可以获得非常强大的处理能力。

2)属性谓词

含有属性name的meta元素：

>>>doc.xpath('/html/head/meta[@name]')

,,,]

含有属性name而且其取值为robots的meta元素：

含有任意属性的meta元素：

>>>doc.xpath('/html/head/meta[@*]')

3)函数谓词

xpath内置很多函数，灵活使用这些函数，可以极大提升查找效率，比如：

-使用text()函数

>>>doc.xpath('//td[text()="2017-03-21"]')

-使用contains函数

>>>[td.textfortdindoc.xpath('//td[contains(text(),"2017-03-2")]')]

['2017-03-29','2017-03-28','2017-03-27','2017-03-24','2017-03-23','2017-03-22','2017-03-21','2017-03-20']

-使用starts-with函数

>>>[td.textfortdindoc.xpath('//td[starts-with(text(),"2017-02-2")]')]

['2017-02-28','2017-02-27','2017-02-24','2017-02-23','2017-02-22','2017-02-21','2017-02-20']

>>>[td.textfortdindoc.xpath('//td[text()>21.0andtext()<23.0]')]

['21.02']

>>>[td.textfortdindoc.xpath('//td[text()<-2.5ortext()>21.0]')]

['21.02','-2.64']

通配符

xpath也支持通配符"*"，其中'*"可以匹配任何标签元素，"@*"可以匹配任何元素属性，node()可以匹配任何节点：

>>>head.xpath('./*')

,,,,,,,,,]

>>>head.xpath('./meta[@*]')

>>>head.xpath('./node()')

HOT SUMMER

每天都是不一样，积极的去感受生活

C#Xpath解析HtmlDocument的使用方法与递归取得页面所有标签xpath值（附源码）

在学习HTML Xpath之前呢我们先来下载一下Dll文件

下载地址：http://htmlagilitypack.codeplex.com/

大家下载单击如下图片下载就行了

<ignore_js_op>

接下来就是在程序中引用一下，

<ignore_js_op>

然后就可以直接调用了，大家看看

代码吧

普通浏览复制代码

//htmlDcoument对象用来访问Html文档s

HtmlAgilityPack.HtmlDocument hd = new HtmlAgilityPack.HtmlDocument()

//加载Html文档

hd.LoadHtml(strhtml)

string str = hd.DocumentNode.SelectSingleNode("//*[@id='e_font']").OuterHtml

这样就可以得到一个标签的HTml代码了

OuterHtml是取包含本身的Html如果是InnerHtml就是取的包含在这个标签之内的所有Html代码了

这点大家要注意了

如果大家想获取Html代码的Xpath路径就是这部分

//*[@id='e_font']

复制代码

这个其实很简单只在大家安装一个Firbug就行了，

看下图片

<ignore_js_op>

大家只要进入选择模式，然后选择你要的内容，然后右键复制一下就行了。

然后放在SelectSingleNode（）方法里就OK了

下面我说说几个方法和属性的意思吧、

方法

SelectNodes 获取的是一个集合

SelectSingleNode 获取一个标签

SetAttributeValue 设置标签的属性值例如：SetAttributeValue("name","xpath-89")这说明把name属性的值修改为xpath-89

属性

OuterHtml 是取包含本身的Html

InnerHtml 取的包含在这个标签之内的所有Html代码了

XPath 获取相对应的Xpath值

Attributes 获取一个属性的值例如：Attributes("name")

也可以进行添加属性例如：

普通浏览复制代码

hd.DocumentNode.SelectSingleNode(item.Key).Attributes.Add("xpathid", "xpath_1" )

下面我写了一个递归获取Html页面所有Xpath值的方法大家看一下吧

普通浏览复制代码

//key（Xpath）,value（整个节点）

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：电脑缓存怎么清理

# 下一篇：现在找到 1st JavaScript Editor，好像还行。我是刚接触JS没几天的，这个软件有自动完成和提示功能。