jsoup解析html的table中的内容

2023-03-04 12:55:01html-css027

jsoup解析html的table中的内容,第1张

public void parse(){

String htmlStr = "<table id=kbtable >"

+ "<tr>"

+ "<td width=123>"

+ "<div id=12>这里是要获取的数据1</div>"

+ "<div id=13>这里是要获取的数据2</div>"

+ "</td>"

+ "<td width=123>"

+ "<div id=12>这里是要获取的数据3</div>"

+ "<div id=13>这里是要获取的数据4</div>"

+ "</td>"

+ "</tr>"

+ "</table>"

Document doc = Jsoup.parse(htmlStr)

// 根据id获取table

Element table = doc.getElementById("kbtable")

// 使用选择器选择该table内所有的<tr><tr/>

Elements trs = table.select("tr")

//遍历该表格内的所有的<tr><tr/>

for (int i = 0i <trs.size()++i) {

// 获取一个tr

Element tr = trs.get(i)

// 获取该行的所有td节点

Elements tds = tr.select("td")

// 选择某一个td节点

for (int j = 0j <tds.size()++j) {

Element td = tds.get(j)

// 获取td节点的所有div

Elements divs = td.select("div")

// 选择一个div

for (int k = 0k <divs.size()k++) {

Element div = divs.get(k)

//获取文本信息

String text = div.text()

//输出到控制台

System.out.println(text)

}

除了正则之外，还有一个方法就是XSL解析，

例如您的这个我可以使用此XSL文件解析。

<?xml version="1.0" encoding="utf-8" ?>

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>

<xsl:template match="/">

<xsl:value-of select="//div[@class='skcx_B']"/>

</Content>

</xsl:template>

</xsl:stylesheet>

当然，您要排除唯一性，就是说class中的skcx_B只在这里有，如果其他地方有，可以使用这种方法获取

<xsl:value-of select="//div[@class='skcx_B'][1]"/>

这个[1]是指<div class="skcx_B"></div>处在第几个位置，

记住：这个是从1开始的，并不是从0开始的。

嗯，差不多是这样的，因为网页在读取table数据的时候，要将table内的所有td tr tbody 这些内容数据下载完后才会显示出来，而DIV就不一样了，它是读一个就显示一个，效率当然高多了。

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：div+css中ul.ol.dl什么区别？

# 下一篇：CSS图片剪切

给您推荐相同类型的内容：

电脑重装系统之后开机桌面上什么都没有，是怎么回事？
1、首先需要打开自己的电脑桌面找一个空白处，然后需要用鼠标单击自己的鼠标右键：2、接着需要在接下来弹出的页面框下拉菜单中，找到并点击页面框上方的“查看”按钮：3、最后只需要在弹出来的页面框中勾选“显示桌面图标”按钮即可解决电脑重装系统之后开
怎么把原电脑中的文件彻底清除？
把原来电脑中的东西彻底清除干净的方法如下：1、先把系统分区以外的其它各硬盘分区格式化一次后，往里面再存大量文件，再格式化一次，基本就找不回来了。2、使用硬盘低级格式化软件把整个硬盘进行格式化，即使普通的专业数据恢复也很难再恢复出来。3、给电
电脑线太多怎么整理?
问题一：家用电脑线多乱怎么整理？电脑完全无线化暂时还难以实现，既然线缆是喜欢整洁的PC用户躲不开的梦魇，那么我们就正视问题，寻求解决之道。 1、线缆在用户桌面最难以搞定的一般有三大问题：一是线缆在桌前不整洁，一般是在显示器附近区域堆
html常用的三种定位是什么
在一般的前端开发中比较常用的定位有三种：相对定位，绝对定位，固定定位。下面简要的说明一下他们的使用特点：相对定位position:relative1.它可以在四个方向分别或者同时进行偏移 2.定义时它的参照物是父元素（没有时为浏览器本身
如何给电脑设置密码
电脑设置开机密码XP系统的方法。第一步、点击左下角开始，选择控制面板(有的可以右击我的电脑)。第二步、然后在选择用户账户。第三步、一般没有设置密码的需要设置Administrator的管理员密码!也可以创建新的账户。第四步、然后在选择创建密
电脑远程在哪里开请问
1、以win7系统为例，首先右键点击“计算机”图标，在弹出的选项中选择“属性”。2、在打开的“属性”页面中点击左侧菜单中的“远程设置”。3、然后在弹出的属性对话框中将“允许远程卸妆联机而这台计算机”前面的勾选框选中。4、再将“远程桌面”勾选
急！！推荐几款好玩的单机游戏！
鬼武系列也不错的比较复古~ 角色扮演的嘛~ 首推鬼泣3和4 个人觉得蛮不错的~ 以下仅供参考：史上最好玩的单机游戏2007-05-16 01:021英雄萨姆 2DOOM3毁灭公爵毁灭战士3(Doom3) doom3 同上，画面和名气很大，
鼠标指针如何改
1、打开电脑，在桌面按右键，打开电脑操作系统自带的快捷菜单。2、在快捷菜单中点一下个性化。3、进入个性化设置窗口。4、在左侧点一下更改鼠标指针。5、在左侧点一下更改鼠标指针。6、点一下方案右边的下拉箭头。7、可以看到鼠标指针各种不同的方案。
html中能显示图片流吗
你好。可以用流的形式往客户端写文件，也就是在客户端看来是文件，在服务器看来是流。实际上验证码图形输出都是这么做的。给你个例子：MemoryStream ms = new MemoryStream()img.Save(ms, System
怎么解决html文件乱码现象
html文件乱码一般是因为编码格式不匹配造成的，现在大部分浏览器默认编码的是utf-8，所以解决乱码问题搞清楚编码格式就可以了，下面介绍下解决的方法工具材料notepad++ 01打开notepad++，新建一个HTML文件
谦卑的本质
周易是以时与位的不同剖析事物的本质规律和运行规律的学说。出生初创重在时，离世结束重在位，过程是时与位的综合考虑。接下来我们就用易经的谦卦来分析谦卑的六层境界。谦卦是64卦中唯一一个六爻皆是好的卦谦卦象征着谦虚，具有谦虚的美德，很亨通，只有君
html5div可随意拖动怎么实现
1、不自定义进度条的话就只能用默认进度条，默认的进度条是集合在video标签中的，这个我们无法实现不能拖动，但是可以模拟下，你可以使用让鼠标点击到视频所在的video或者div的时候无效化，原理就是鼠标选不到进度条，自然不能拖动了。如果你是
html网页设计表格,如何通过css让表格只有外边框,而没有内边框?或者只有内边框,而没有外边框？
table{x0dx0aborder:1px solid #000*黑色1像素粗边框*x0dx0a}x0dx0atd{x0dx0aborder:none*这个是单元格，不给他要边框*x0dx0a}x0dx0a
笔记本电脑的型号怎么看?
如果您使用的是华为笔记本电脑，可以通过以下方法查询计算机型号：方法一：可通过机身背面或侧面上的标签查看计算机的型号。方法二：1.按下“Win + R”组合键，输入“dxdiag”后回车。2.选择“系统”选项卡，查看计算机的型号。方法三：1.
电脑磁盘损坏怎么修复？
你好，很高兴为你解答：方法一：使用系统自带工具修复损坏的文件Windows 7用户：步骤1. 右键点击有损坏文件的磁盘，然后点击“属性”。步骤2. 在“属性”窗口中点击“工具”选项卡。步骤3. 在“查错”区域中点击“开始检查”，然后在弹
硬盘主盘从盘是什么意思？
主盘从盘是相对于两块以上的硬盘来说的。比如电脑中有一块硬盘，那么设置成主盘从来都无所谓。进入系统都是用这个硬盘的系统。如果电脑中有A、B两块硬盘。A硬盘有已经安装好的系统，B硬盘没有操作系统，那么就要设置A为主盘。B为从盘或自动选择。
怎样用html做个表格啊。
html做个表格的步骤如下：1、首先新建一个html，点击&ltbody&gt&ltbody&gt中间，先填入表格内容；2、内容根据需求来写即可，示例代码如下：&lttable&gt&
网上说女孩子js是什么意思?
JK是来自于日本流行网络用语，意为女高中生，通常指日本女高中生。也是二次元文化中的萌萌的那种女孩。JS则是小学女生（女子小学生「じょししょうがくせい」）的略称。相关动漫：电视动画《女高中生的虚度日常》改编自ビーノ创作的同名漫画作品，由Pa
CSS水平居中的9种方法
容器的居中显示在网页设计中是很常见的，居中显示可以获得视觉的焦点，是内容更加突出，下面就简单的说明一下如何在HTML中通过样式的控制来实现 01最常见的一种，代码示例如下图，首先，取big一半像素大小赋给small层，通过marg
dw打不开html网页闪退
您想问的是dw打不开html网页闪退的原因吗？网站暂存记忆读取错误。dw打不开html网页闪退是因为Dream weaver记录的网站暂存记忆读取错误，导致开启中途遇到失败，就自动关闭，进入注册表找到HKEY这个选项下面的sites下所有的
岩海高应变新软件 JS值和JT值是哪个
始值和引用值在 ECMAScript 中，变量可以存在两种类型的值，即原始值和引用值。原始值存储在栈（stack）中的简单数据段，也就是说，它们的值直接存储在变量访问的位置。引用值存储在堆（heap）中的对象，也就是说，存储在变量
qq三国名字男js.要好听的.繁体字.要好看的符号
丶暧眛庅灬yEs 丶劈腿yEs（绫乱〆dê訫糊涂〆清醒梦境の邂〆逅绫ぁ识〆dê矃风华☆GG 北极づ莜〆蓝﹎◇..绿嗏o Γ霹雳〆Ж晴空 ~ж嗳〆嬎~ 少钩〆鈏我﹎ __眼〆泪啲錵吙 o蕶薍﹎莣忧〆dě浮云蘰踄〆繧鍴灬
设置表格的单元格填充为0的html代码
设置表格的单元格填充为0的html代码tablecellpadding。cellspacing意思是table表格中的单元格子之间的空白距离为0像素，，cellpadding属性用来指定单元格内容与单元格边界之间的空白距离的大小。图片放进h
网页制作添加欢迎界面
那就使用flash制作吧。制作好之后可以发布为带有html网页的文件，可以直接使用这个网页作为你的欢迎界面。也可以使用dreamweaver把falsh的swf文件插入到网页里，保存为网页。很简单：设置网站的优先级。比如设置index.ht
零基础的学平面设计,大概要多久?
自学的话时间是不确定了，这个就要看个人的学习能力了，报班的话，有周末班和全日制班，全日制班一般是3.4个月，当然啦，个人学习能力强的话，时间还是可以提前的。想要学好平面设计其实不难最主要是有没有决心，不妨先用60秒时间来测试下→→点击测试我
css怎么让一张图片适应任何屏幕大小的电脑平铺?
不定义div的宽度，以及父div的宽度即可。来做一个导航：&ltstyle typr="textcss"&gt*{margin:0padding:0border:0}.navbg{background:
css样式怎么去除图片自带的边框
要加分哦img没边框css样式 img｛padding:0border:0margin:0display:block｝截取是比如图片上的边框是1px.div｛background:url(图片地址) 1px 1px width
JAVA 类名.class是什么意思？
ConfMgr.class是获取ConfMgr的class对象，类型类指的是代表一个类型的类，因为一切皆是对象，几种获取class对象的方法：1，所有的引用数据类型（类-类型）的类名、基本数据类型都可以通过.class方式获取其 Clas
电脑配置里面哪个配件最贵？
仕明同学2020-01-07电脑是人类在20世纪所取得的最重大的科学技术成就之一，它与电视和飞机并列为20世纪对人类影响最大的三大发明，电脑有三大硬件是主板、CPU和内存，其中最值钱的是CPU和显卡，我来说下为什么，有可能说的不准确！！先看
我的平板电脑变成外文了请教怎么设置回中文
1、下图是已经设置成了英文语言模式。点击图中“settings”选项。2、进入到设置页面后，在左侧选项栏中找图中选项“General”。3、然后在右边的选项中寻找“Language&ampRegion”选项。4、进入页面，可以看到最

推荐阅读

热门文章

最新发布

标签列表

jsoup解析html的table中的内容

给您推荐相同类型的内容：