java爬虫怎么抓取js动态生成的内容

2023-04-15 15:49:02JavaScript020

java爬虫怎么抓取js动态生成的内容,第1张

我用Jsoup写爬虫，一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。

1、有些页面元素被隐藏起来了->换selector解决

2、有些数据保存在js/json对象中->截取对应的串，分析解决

3、通过api接口调用->伪造请求获得数据

还有一个终极方法

4、使用phantomjs或者casperjs这种headless浏览器

Java 代码如下：

//得到要转换的数组---当然这里也可以是其他类型的数组

List jsList = (List) request.getAttribute("gczbh")

JS 代码如下：

function initPages()

{

var codes = new Array()

// 将JAVA中的数组转换成JS 的数组

if(jsList!=null)

{

for(int i=0i<jsList.size()i++)

{

codes[<%=i%>]='<%=jsList.get(i)%>'

<% }

}

</script>

JavaScript有两种地方存在，一是在页面就写出来的，二是引用的。

1.直接写出来的，一看就明白（右键->查看页面源代码）

2.引用的，就比如说这个页面吧，其中有下面代码：

<head>

</script>

</head>

通过这段代码（src="/userlogin.js?213"）知道他引用的位置是http://zhidao.baidu.com/userlogin.js,输入这个网址看看效果，就是document.domain="baidu.com"document.write("等等，这就是他引用的JS了。

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：如何防止js和css缓存

# 下一篇：电脑输入法怎么切换

给您推荐相同类型的内容：

Date对象
Date对象（日期对象）来实现对日期和时间的控制。日期对象是对一个对象数据类型求值，该对象主要负责处理与日期和时间相关的数据信息。在使用Date对象前，首先要创建该对象。语法：下面以示例的形式来介绍如何创建日期对象。例子
怎么样下载js
你是要下载HTML网页中的js么？用chrome访问网页，viewsource查看网页源代码，找到要下载的js文件，点击就打开了，然后拷贝或者另存就行。浏览器都有查看网页源代码功能的是完全可以查到的，但正常情况下不会bai去帮你查,需要先去
前端自动化测试框架Jest 基础入门-
　一、引言前端这几年发展的非常迅速，我们的系统的功能正在变的越来越复杂，这对我们的前端工程化能力提出了更高的要求，听到工程化，大家的第一反应肯定是高质量的代码设计和高质量的代码实现。但实际上，前端自动
如何用纯css实现一个动态画圆环效果
html结构如下：&ltdiv class="wrap"&gt&ltdiv class="circle"&gt&ltdiv&gt&ltdiv
CSS3伸缩布局
我们知道，标准流中的，父容器里的多个块级的子元素会默认从上往下排列。但我们如果使用伸缩布局，就可以使子元素们在不脱离标准流的情况下，水平方向上，从左至右排列flex 布局的优势1、flex 布局的子元素不会脱离文档流，很好
用html做的一个form+table注册页面里有一个验证码，要怎么写这个js代码？？
可以用JS做个简单的验证码 &ltscript language="javascript"&gtvar code在全局定义验证码function createCode(){ 创建验证码函数 co
js是电脑的什么语言？
编程语言。js即JavaScript，分为前端和后端编程。前端js主要在浏览器中通过api对html及css动态修改，从而达到在不刷新页面的情况下实现动画效果或数据动态绑定等。后端js主要指“node.js”，与其他php、java等后端语
k-means聚类算法的java代码实现文本聚类
K-MEANS算法:k-means 算法接受输入量 k ；然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引
for( i = 0 ; i <= 24 ; i++){ $("p").eq(i).css({"top"：parseInt(i5) * 82，"left"：i % 5 * 194})
这是把25个元素排成5行5列的方阵。parseInt(i5) 是计算每个元素的行号，当i=0到4时，parseInt(i5) 的值是 0，表明0到4这5个元素是第1行，当i=5到9时，parseInt(i5) 的值是 1，
利用js中的冒泡，把对象中的进行排序
var arr = [{ name:"张三1", shuxue:98, yuwen:34, yingyu:89},{ name:"张三2", shuxue:56,
美金符号怎么打
美金符号是＄，在word中，可以通过插入特殊符号来录入，具体操作步骤如下：1、新建一个word文档，并打开，然后点击插入；2、接着点击符号下拉箭头，再点击其他符号；3、进入符号窗口之后，字体选择普通文本；4、选择完字体之后，在下面就能看到
电脑上中间点号怎么打
问题一：中间的点在电脑上怎么打出来？就是键盘上最左上角那个键和“~”是同一个键，要在中文输入法状态下，中文标点状态下。问题二：电脑上中间一个点的标点符号怎么打出来？你切换到中文输入法状态，输入法标识上有一个类似于键
电脑微信怎么下载到桌面
在电脑端下载“微信”安装包，安装成功后，找到菜单中“微信”启动项，用鼠标右键点击后选“创建桌面快捷方式”，成功后就可以在桌面上找到“微信”启动图标了。1、首先打开电脑的浏览器，并搜索微信。2、然后选择后面有官方标签的网站，再点击免费下载。3
js如何设置div的宽高
&lt!DOCTYPE html&gt&lthtml lang="en"&gt&lthead&gt&ltmeta charset="UTF-8&qu
Node.js node-schedule定时任务隔多少分钟执行一次的方法
参考代码： var schedule = require('node-schedule') var rule = new schedule.RecurrenceRule()每隔 30 分钟执行rule.minut
css盒子模型及盒子模型的类型
转自菜鸟教程所有HTML元素可以看作盒子，在CSS中，"box model"这一术语是用来设计和布局时使用。 CSS盒模型本质上是一个盒子，封装周围的HTML元素，它包括：边距（外边距），边框
如何用js监听滚动条滚动事件
&ltscript&gtwindow.onscroll=function(){变量t就是滚动条滚动时，到顶部的距离var t =document.documentElement.scrollTop||document.b
手机怎样在电脑上登录微信
在电脑上登录微信的方法如下：双击桌面的微信图标，运行微信。如果是第一次登录，会出现二维码。打开手机微信的扫一扫，扫码登录；扫描后，在手机上点击确认以登录；在手机上打开微信，出现登录确认界面，点击登录，可以开始使用。如果不是第一次登录，运行微
如何查看自己电脑的ip地址？
利用电脑控制面板的“网络和共享中心”，找到“查看网络活动”项下的右侧“连接”一栏，点开查看详情就可以查看了。具体操作方法如下：1、打开电脑桌面，找到并点击左下角的开始菜单，选择进入“控制面板”。2、接着在控制面板中，找到并点击进入“网络和
css after 插入图片，怎么设置内容高度
1.我们首先创建一个新的测试项目，然后创建一个新的index.html、basic.js和basic.css文件。2.js修改文件中的样式中值div以修改div高度。文件中的文件代码如图所示。3.我们看到3运行后两个div的高度是一样的..
css 通配符（*，#，.）
这个也没有别的意思#div_test #只代表这是一个ID选择器。仅代表是一个类别选择器#号后面的是元素的ID。号后面的是元素类名如果没# .这种标识符那就不能区分div_test 是ID选择器，还是类别选择器代码就无法执行，，，这个学久
求高手，怎么实现用JQJS 手机屏幕左右滑动的功能
调用方法如下：touchs._left(object)往左滑动touchs._right(object)往右滑动touchs._top(object)往上滑动touchs._bottom(object)往下滑动说明：obje
css 过渡动画属性
transition-property 过渡效果的CSS属性名称 transition-delay 设置过渡延迟时间 transition-duration
用css制作一个会动的球体
您好，可以先画一个有立体感的球体，或者直接网上找个图片，然后给这个球体添加动画，选择强调里的陀螺旋，在效果选项里将重复次数自行设定，就可以实现让球体在地上滚动的效果。同时还可借助在图片上覆盖诸如半透明灰色和半透明白色的圆形形状来实现球体高光
H5用神策数据实现埋点(使用原生或者jq)
1.先引入sensor.js文件 2.全局引入使用sensor 3.点击按钮进行埋点 4.在进入页面的时候会自动触发一个'pageView'事件，点击按钮会触发'webClick'事件参考
js中怎么获取当前年份、月份和日期
JS有自带的日期函数，获取如下：var date = new Date()var year = date.getFullYear()获取年份var month = date.getMonth()+1获取月份，因为是从0-11所以要+
css里面使用scale时出现的小问题，请问如何解决？
一、scale()方法缩放，指的是“缩小”和“放大”。在CSS3中，我们可以使用scale()方法来将元素根据中心原点进行缩放。跟translate()方法一样，缩放scale()方法也有3种情况：（1）scaleX(x)：元素仅水平
怎么样查看电脑内存?
集体操作如下：1.在桌面按下“Win+R”，打开运行窗口。2.输入“dxdiag”，点击“确定”。3.在弹出来的页面中即可看到电脑内存。使用相关的软件查看一下原有的笔记本内存型号，不同型号的笔记本内存不可混用。特别要注意的是最好装同一种频率
js怎么把数字金额转换中文大写金额
代码如下所示：function convertCurrency(money) { 汉字的数字 var cnNums = new Array('零', '壹', '贰',
C语言好还是C++好
C与C++的最大区别:在于它们的用于解决问题的思想方法不一样。之所以说C++比C更先进，是因为“设计这个概念已经被融入到C++之中”，而就语言本身而言，在C中更多的是算法的概念。那么是不是C就不重要了，错！算法是程序设计的基础，好的设计如果

推荐阅读

热门文章

最新发布

标签列表

java爬虫怎么抓取js动态生成的内容

给您推荐相同类型的内容：