怎么爬取网页的动态内容，很多都是js动态生

2023-03-02 21:37:01JavaScript031

怎么爬取网页的动态内容，很多都是js动态生,第1张

抓取动态页面有两种常用的方法，一是通过JavaScript逆向工程获取动态数据接口（真实的访问路径），另一种是利用selenium库模拟真实浏览器，获取JavaScript渲染后的内容。但selenium库用起来比较繁琐，抓取速度相对较慢，所以第一种方法日常使用较多。

js获取页面请求了dataType是json,contentType是接口，页面抓取又称为网页抓取,它主要是指搜索出新的网页,搜集那些在上次搜索后有改变的网页,或者搜索到以前不存在的网页,并从库中删除。

String url = "http://xinjinqiao.tprtc.com/admin/main/flrpro.do"

try {

WebClient webClient = new WebClient(BrowserVersion.FIREFOX_10)

//设置webClient的相关参数

webClient.getOptions().setJavaScriptEnabled(true)

webClient.getOptions().setCssEnabled(false)

webClient.setAjaxController(new NicelyResynchronizingAjaxController())

//webClient.getOptions().setTimeout(50000)

webClient.getOptions().setThrowExceptionOnScriptError(false)

//模拟浏览器打开一个目标网址

HtmlPage rootPage = webClient.getPage(url)

System.out.println("为了获取js执行的数据线程开始沉睡等待")

Thread.sleep(3000)//主要是这个线程的等待因为js加载也是需要时间的

System.out.println("线程结束沉睡")

String html = rootPage.asText()

System.out.println(html)

} catch (Exception e) {

}

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：手机酷狗怎么导到电脑

# 下一篇：腾讯会议怎么镜像翻转

给您推荐相同类型的内容：

腾讯会议怎么镜像翻转
腾讯会议可以通过开启镜像弄出镜像翻转效果，下面是具体操作步骤。工具／原料：荣耀play5、Magic UI4.0、腾讯会议3.8.5.4291、点击自己的头像打开腾讯会议主页，点击自己的头像。2、点击设置在个人主页，下拉点击【设置】
html4和html5的区别
HTML5与HTML4区别如下：1、语法简化HTML、XHTML的DOCTYPE、html、meta、script等标签，在HTML5中有大幅度的简化。2、统一网页内嵌多媒体语法以前，在网页中播放多媒体时，需要使用ActiveX或P
js如何获取用户输入的textarea的内容
&lttextarea id="reason"&gt&lttextarea&gt。var $reason = document.getElementById('reason&
笔记本电脑桌面上的蓝牙快捷键无法删除，怎么办？
在我的电脑上右键单击出现属性--硬件--设备管理器--蓝牙设备--（右键单击下，出现停用）停用设备或是你可以直接删除，右键单击蓝牙，选择删除，这样只是删除图标不删除驱动，还有就是移动，右键单击蓝牙，移动到一个文件夹里。我不知道你电脑的配置，
手机取代了大部分电子产品，那么手机会被什么取代？
也不能说电脑被手机取代了，电脑依然很重要，只是很多电脑的功能被手机给替代了。比如看视频，现在大部分人就用手机随身看了，娱乐的内容和场景都丰富了许多。所以手机跟电脑比，胜在便携性。如果能有另一个全新东西，取代
联想小新air14相册怎么设置密码
1、首先在联想小新air14相册桌面左下角点击开始选项，打开设置页面。2、其次在设置页面中，点击账户选项。3、最后在弹出的页面中，点击指纹登录选项，根据提示设置即可。问题一：电脑上的相册怎么设置密码？你要建立一个新相册目录；一般在
js调用函数怎样传递参数
把参数写在括号里面就可以了var a=1var b=2var c= myaddfun(a,b)alert(c)function my addfun(a,b){ 注意这里的 a 和b
如何让笔记本电脑连接上网络？
让笔记本电脑连接上网络可以通过任务栏右下角有一个连接无线的标志，访问电脑网络，从而设置密码进行连接，具体如下：1、进入电脑桌面后，可以看到任务栏右下角有一个连接无线的标志，点击。2、在这里就可以看到笔记本电脑可访问的无线网。3、点击知道的
用纯CSS如何制作流行的TAB菜单？
Tab菜单比较简单的方法是直接使用dreamweaver cs3的spry制作,其他方法制作难度比较大，不管哪种方法，必须要使用javascript调用。&ltul class="tabs"&gt&
css中图片在滚动框架里怎么居中
css是英文Cascading Style Sheets的缩写,它是一种用来表现HTML（标准通用标记语言的一个应用）或XML（标准通用标记语言的一个子集）等文件样式的计算机语言。解决方法有：1、按图中的代码运行：2、最简单的居中te
js代码如何实现时间段判断?
&lt!DOCTYPE HTML&gt&lthtml lang="en-US"&gt&lthead&gt&ltmeta charset="UTF-8&qu
怎样才能把我的苹果手机和我的电脑连接
将苹果手机与电脑连接，步骤如下：1、首先打开http:www.apple.comcn到苹果官网上，点击苹果官网页面栏目上的”iTunes“进入页面。接着点击iTunes下载按钮，下载苹果iTunes软件并安装到电脑上面；2、iT
html如何跟css链接
1、当我们没有引入外部css样式表的时候，一般情况下我们会在html里写样式，而又两种方式使我们常见的，第一种：&lthead&gt&ltmeta http-equiv="Content-Type&qu
笔记本电脑发热卡顿怎么办
1. 我的笔记本电脑发热现象和卡顿比较严重,怎么办电脑卡顿，有两方面原因，一个是软件，一个是硬件。关于软件，建议你，重新装下系统，如果你的配置不高，可以装XP系统，如果不喜欢XP，非要装7系统，那么建议，分区的时候，C盘分50G，
电脑有哪些牌子，它们的英文简写是什么
1、戴尔（英文简称Dell）戴尔是一家来自美国的电脑品牌公司。它主要以生产笔记本而闻名。他的理念非常简单：按照客户要求制造计算机。并向客户直接发货，使戴尔公司能够最有效和明确地了解客户需求，继而迅速做出回应。这个直接的商业模式消除了中间商
如何查看电脑配置？
通过在运行里面输入“dxdiag”命令，来查看电脑配置；具体步骤如下：1、在运行里面输入“dxdiag”。2、若弹出一个DirectX诊断工具对话框，提示我们是否希望检查，点击确定即可。3、通过弹出的DirectX诊断工具界面来查看电脑的
怎样在电脑桌面上制作倒计时？
除了用图片来做桌面以外，我们还可以用html页面来做桌面。在这里我们就是利用html能够显示动态时间的原理来做一个动态的倒计时桌面。第一步:找来一张喜欢的壁纸，放到一个文件夹里,并命名为：backpictrue.jpb。第二步:在这个
iPad怎么设置才可以发短信？
步骤：1、在iPad上登录Apple ID帐号。2、点击下一步。3、添加收信联系人，输入内容，点击发送。4、发送成功。5、注意事项：只有苹果设备可以相互之间发短信。ipad并没有内置电话组件，支持sim卡，主要是方便用户即可使用移动网络上
如何只用HTML画出一个圆角的Table表格
&ltul style="list-style:noneborder:1px #FF0000 solidborder-radius: 4pxwidth:100px"&gt&ltli&g
Win10版本号在哪里查看，怎么查看Win10系统版本
1，打开windows10系统，在开始菜单中点击“设置”选项，点击打开。2，接着，在设置中点击“系统”选项，点击进入。3，在窗口中点击“关于”选项，点击进入。4，最后，即可在电脑窗口中看到win10的版本号，问题解决。如何查看window
为什么LOL云顶进不去但是能听到声音
为什么LOL云顶进不去但是能听到声音大概电脑垃圾过多，主机卡了。或者是显示器信号输入问题alt+enter切换窗口模式试试如果你配置没问题的话，要么就是你电脑垃圾过多，主机卡了；要么就是你这时的网络不大流畅。网络卡住了，网速不够cpu或者
如何量平板电脑的尺寸？
要量平板电脑的尺寸，你可以使用下列步骤：找到一张纸，将其放在平板电脑的屏幕上。用尺子测量平板电脑屏幕的宽度。用尺子测量平板电脑屏幕的高度。用尺子测量平板电脑整体的厚度。将测量结果记录下来，这就是平板电脑的尺寸。注意，你测量的尺寸是
电脑哪种输入法打字速度快（电脑哪种输入法最好用）
您好,现在我来为大家解答以上的问题。电脑哪种输入法打字速度快，电脑哪种输入法最好用相信很多小伙伴还不知道,现在让我们一起来看看吧！...您好,现在我来为大家解答以上的问题。电脑哪种输入法打字速度快，电脑哪种输入法最好用相信很多小
电脑为什么软件全屏不了怎么办
1. 电脑软件打开不能全屏怎么办 1、点开始——运行，输入“regedit”回车。2、“注册表编辑器”窗口被分为左右两格。在左边大格依次双击展开各项HKEY_LOCAL_MACHINE„„SYSTEM„„CurrentControl
电脑怎么把视频压缩
视频压缩的方法如下：方法一：改变文件格式的压缩。这种方法压缩视频的前提是需要我们安装了解压应用，它不会影响视频的质量以及清晰度，操作起来也很简单，但是压缩之后没有办法直接观看视频，需要解压了才能使用，并且它的压缩率并不高，比起未压缩的视频来
职高计算机大学可以选哪些专业？
职高计算机专业考大学可以选的专业有什么?计算机网络技术,学习数据库,C语言,网络,操作系统,办公自动化,。计算机软件,关键学习JAVA,C语言,办公自动化。计算机及应用:电路和电子技术、数字电路和逻辑电路、数据结构、计算机组成原理、操作系
使用R语言进行卡方检验（chi-square test）
文|程瑞林（山东大学第二医院足踝外科）来源|（微信公众号）云中瑞麟（ID：ruilinfly）瑞麟导读：对于计量资料，临床医学研究中常用的统计分析方法是t检验；而对于计数资料，卡方检验是一个常用的统计分析方法。最近
电脑开机运行的程序太多怎么办？
我们使用电脑的目的，就是运行各类软件，获得运算结果。但是，有些人给电脑安装了太多的软件，导致电脑开机时加载的软件过多，使得电脑的运行速度受到影响。……这时候，我们需要采取措施提升电脑性能，改善电脑运行状态，来保证电脑的流畅运行。具体来说，我
index.html是什么
index.html是网站的首页文件。HTML是网页文件，也叫超文本文件（HyperTextMarkupLanguage）的后缀，所有的网页文件都是要转化成html文件展示在浏览器里的。HTML是用于超文本文件编写的技术规范，其主要内容就定
广联达是什么
广联达全称是：北京广联达软件股份有限公司，是一家专业的工程造价软件开发商，提供全面的工程造价整体解决方案，具体可以登录广联达服务新干线。专业，市场占有率遥遥领先，我正下用广联达软件，就一句话，很好很强大，推荐购买学习使用。记得采纳广联达软件

推荐阅读

热门文章

最新发布

标签列表

怎么爬取网页的动态内容，很多都是js动态生

给您推荐相同类型的内容：