如何爬取网页中js动态生成的数据

2023-03-03 11:00:01JavaScript018

如何爬取网页中js动态生成的数据,第1张

String url = "http://xinjinqiao.tprtc.com/admin/main/flrpro.do"

try {

WebClient webClient = new WebClient(BrowserVersion.FIREFOX_10)

//设置webClient的相关参数

webClient.getOptions().setJavaScriptEnabled(true)

webClient.getOptions().setCssEnabled(false)

webClient.setAjaxController(new NicelyResynchronizingAjaxController())

//webClient.getOptions().setTimeout(50000)

webClient.getOptions().setThrowExceptionOnScriptError(false)

//模拟浏览器打开一个目标网址

HtmlPage rootPage = webClient.getPage(url)

System.out.println("为了获取js执行的数据线程开始沉睡等待")

Thread.sleep(3000)//主要是这个线程的等待因为js加载也是需要时间的

System.out.println("线程结束沉睡")

String html = rootPage.asText()

System.out.println(html)

} catch (Exception e) {

}

我用Jsoup写爬虫，一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。

1、有些页面元素被隐藏起来了->换selector解决

2、有些数据保存在js/json对象中->截取对应的串，分析解决

3、通过api接口调用->伪造请求获得数据

还有一个终极方法

4、使用phantomjs或者casperjs这种headless浏览器

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：买电脑什么牌子最好用

# 下一篇：家里的网线应该怎样连接电脑？

给您推荐相同类型的内容：

新买的台式电脑找谁鉴定是不是新机？
电脑里面一般只有硬盘有通电次数和工作时长的记录，可以通过HD TUNE等测试软件读取到，如果新电脑的硬盘已经通电几百次，工作几千小时，那肯定是旧机器。其他配件没有通电记录，一般是看金手指、插槽、散热器，像内存条、显卡的金手指如果有比较多的拔
电脑键盘复制粘贴是哪个键
电脑键盘复制粘贴键是Ctrl+C，粘贴键是Ctrl+V。选择需要复制的内容之后，直接按快捷键“Ctrl+C”就可以复制上内容。也可以右击鼠标，点击“复制”选项进行复制内容。然后鼠标定位到需要粘贴内容的位置后，按快捷键“Ctrl+V”就可以粘
CSS常见问题一（span文字如何居中）
如果span 设置了 height 那么直接使用 line-height与设置的height 值相同即可以实现垂直居中，例如: html中：然后在css中: 即可实现span中，“这里是文字” 部分文字内容的垂直居中。
HTML5三种对密码加密的方法
1、base64加密：在页面中引入base64.js文件，调用方法为： 2、md5加密：在页面中引用md5.js文件，调用方法为 3、sha1加密，据说这是最安全的加密：页面中引入sha1.js，调用方法为 base64.js：
华硕笔记本保修多长时间，包括哪些方面
华硕消费类笔记本电脑保修信息如下：1、常规保修信息：2、其它部件保修期限的辨识方法：请参考主机背部序列号贴纸上的Warranty后面的一组独立的两位阿拉伯数字，如下图所示的“24”，即代表其它部件保修两年。或下图所示的“12M”即代表其它
CSS定位网页中元素的题
要文字显示在图片上方（含文字在上层的情况，即不被图片遮挡），则文字需要脱离文档流，那么首先排除在图片上做文章的 A、B 两项。再来看 C、D 两项，这两句都能使文字层脱离文档流，但 C 项的代码仅让文字层显示在了图片的“上层”，而 D 项
如何让在Html中特殊字符不被转义
转义字符有很多，在实际编程过程中常常会用到，那么下面介绍一下常用的转义字符。1、首先打开pycharm，新建一个工程和python文件，如图。2、打印一段话，输入print添加内容，如下图所示。3、接着转义字符"n"
电脑显示亮度怎么调？
电脑显示屏怎么调整亮度有以下两个方法：方法一：在windows7操作系统中其实进入电脑设置电脑屏幕亮度选项也非常容易，从开始-控制面板，点击系统和安全，点击电源选项，拖动滚动条调节屏幕亮度即可，当然也有更快得方法，直接同时按住Win+X组合
shipadoo键盘怎么调灯光
按住凌豹键(FN键）+F7或按住凌豹键(FN键）+S6(4下)共6排依次是：绿，深蓝浅蓝，紫，橙，红,效果：关闭键盘灯。按住任意一个键，键盘灯由此向四周扩散闪烁，向水面的水花荡起的涟漪。按住凌豹键(FN键）+F8与按住凌豹键(FN键）+S3
想组装一台秒杀所有游戏的电脑，求高人指点，预算10万以内？
CPU：锐龙ThreadRipper 2990WX显卡：七彩虹RTX2080Ti Vulcan X * 2内存条：美商海盗船统治者 16G 3600MHz * 8主板：微星X570CPU散热器：酷冷至尊冰神P360电源：美商海盗船AX16
如果判断榴莲的生熟
榴莲虽然好吃，但不可一次吃得太多，不然容易导致身体燥热。以下是我整理的如果判断榴莲的生熟，希望对大家有所帮助。没开口的榴莲要放几天要看它熟的程度，不熟的放再久还是不能吃，最后就长毛了，所以买的时候一定要挑熟最好是自然裂开的，切
现在html用什么方法加密密码？
html加密密码的方法有很多，比如：md5加密：在页面中引用md5.js文件，base64加密：在页面中引入base64.js文件，sha1加密，据说这是最安全的加密：页面中引入sha1.js等。静态页加密码只能对付一下菜鸟，因为静态页的密
程序员有哪些交流社区或者论坛？
作为一名低代码平台领域的厂商，经常去的一些国内社区网站及论坛，关于程序员的交流社区或者论坛，这里收集一些比较好的开发者社区供大家参考，具体如下：1、CSDN -专业开发者社区 IT技术交流平台2、IT圈，圈圈精彩 - 原软媒论坛、IT之家，
京东商城pc和商城app什么意思
京东商城PC指的是京东商城的网站版本，用户可以在电脑上访问京东商城，浏览商品，下单等。京东商城APP指的是京东商城的移动端应用，用户可以通过下载安装客户端，在手机上访问京东商城，浏览商品，下单等。根据查询相关公开信息，京东商城PC指的是京东
电脑屏幕如何投影到手机屏幕上
通过手机远程控制电脑就可以实现电脑屏幕投影到手机，以teamviewer为例，步骤如下：1、电脑上安装teamviewer软件并打开。2、手机上打开teamviewer，输入电脑上软件显示的id号，点击【远程控制】。3、等待连接校验。4、
联想的电脑在什么情况下才可以更换新机？
首先联想退机换机也是要根据三包法，7天包退，15天包换，15天内当电脑出现硬件故障用户是可以直接申请换机，如果过了15天那么如果商家不同意换机那么无法换机。联想笔记本是指联想集团生产的便携手提电脑。联想集团成立于1984年，由中科院计算
苹果手机怎么弄电脑版网页
现在大部分的手机原生浏览器或者是QQ、UC、谷歌等浏览器，都可以通过在设置中将【浏览器标识】设定为请求桌面版网站，刷新网页即可访问桌面版网页。以下是详细介绍：1、网站的服务器是根据您的浏览器返回的信息和请求来确定显示什么网站的，我们只需要在
台式机电脑开机按什么键可以进行重装系统？
不同的设备按键是不同的1、如果原来电脑装过一键还原软件，装系统时直接在启动画面选择重新恢复系统项即可；2、如需启动光盘或者优盘来重装系统，需要开机按启动热键，选择对应的按键即可调出启动菜单选择界面，在菜单中选择优盘或光驱，按回车，按提示
JS有什么关键字
1.document.write("")输出语句 2.JS中的注释为 3.传统的HTML文档顺序是:document-&gthtml-&gt(head,body) 4.一个浏览器窗口中的DOM顺序是:
买电脑什么配置好
买电脑什么配置好篇11、那么首先带大家了解一下选择电脑选什么样的品牌呢?市场上电脑品牌繁多，那怎么样选择自己喜欢又好看又在自己的预算中呢?目前几大电脑品牌有：国外：IBM 、苹果、戴尔、索尼、东芝、惠普、富士通，宏基，三星
java js css html php他们分别是干什么的？
java是用来开发APP的，安卓上应用、WINDOS应用都有许多是JAVA来写的，源程序是*.java，编译为*.class，可以执行的，打包（和资源一起）后一般为*.jarphp用是来开发动态网站的，在网站服务器上执行，执行的结果才通过网
怎么取消电脑锁屏密码
电脑锁屏密码怎么取消，下面是操作方法。1、首先打开电脑左下角的开始，点击设置。2、然后在弹出窗口中选择账户打开。3、接着在打开的账户窗口中，点击左栏登录选项。4、然后在打开的右边栏中，点击Windows Hello PIN。5、在弹出框中
两台电脑如何共享桌面
问题一：如何让两台电脑共用一个桌面？可以的，直接连接，然后在显卡设置里可以设置显示那个屏幕，或者两个屏幕同时显示，还可以设置分屏，一个设置鼎主屏一个是分屏。如果你的那个是独立显卡的话肯定支持的，我现在07年的老本都支持，你的应该没问题的
win10自带的热点，每次电脑从睡眠中唤起都需要重新打开一次，如何设置成永久打开？
打开设备管理器并设备无线网卡属性：在“此电脑”上点击鼠标右键，在弹出菜单中选择“管理”然后在弹出的菜单中依次选择：设备管理器——网络适配器，在自己电脑无线网卡设备名称（不同的无线网卡名称不同）上右键单击鼠标选择属性最后在弹出的属性框中选择：
电脑分区怎么设置
设置分区方法如下：工具原料华为macbookWindows11菜单管理v2.011、桌面右键点击此电脑，在打开的菜单项中，选择管理。2、计算机管理窗口，点击左侧存储下的磁盘管理。3、选择要分区的磁盘，并点击右键。4、在打开的菜单
如何用CSS控制表格每列的宽度？
如果是简单的表格，直上直下没有跨列或者跨行的：td { text-overflow:ellipsiswhite-space:nowrapoverflow:hidden} * 设置不换行省略号显示*然后只需要再给第一行的td分别加上cl
java适合大学生写的项目有哪些？说全一点。
大部分学生在学习Java的过程中，在Java项目实战方面存在着很多不足，导致在面试的时候无法过关。下面推荐几个适合大学生的Java实战项目：1. 贪吃蛇、俄罗斯方块、打飞机、棋牌类游戏等游戏。在学习完Java常用API后，结合Swings编
买什么电脑好
电脑性价比高的牌子有：1、华硕：品牌主板和散热性能好，外观大方，售后服务态度好。华硕的产品线完整覆盖至笔记本电脑、主板、显卡、服务器、光存储、掌上电脑、智能手机等产品；2、联想：联想电脑的销售量高，适合学生学习用，联想电脑生产时是专业化、流
如何知道自己电脑尺寸
如下：工具／原料：ASUS-FX50、win10操作系统、IE浏览器11.0。方法：1、首先，选中电脑左下方的”我的电脑“，单击”设置“。2、然后，我们在设置界面点击”系统“，如图所示。3、接下来，我们点击左边的”关于“，在右边找到”
给电脑加密怎么取消啊
电脑加密是开机密码吗可以在控制面板里用户账户选择你当前加密的账户再选择更改密码输入新的密码的那里有输入任何字符就行了。如何取消电脑开机的密码锁想取消密码的话点修改密码，不要输入密码，密码就为空，就取消了我的电脑开机时出现密码设定怎

推荐阅读

热门文章

最新发布

标签列表

如何爬取网页中js动态生成的数据

给您推荐相同类型的内容：