java爬虫怎么抓取js动态生成的内容

2023-04-15 15:49:02JavaScript012

java爬虫怎么抓取js动态生成的内容,第1张

我用Jsoup写爬虫，一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。

1、有些页面元素被隐藏起来了->换selector解决

2、有些数据保存在js/json对象中->截取对应的串，分析解决

3、通过api接口调用->伪造请求获得数据

还有一个终极方法

4、使用phantomjs或者casperjs这种headless浏览器

Java 代码如下：

//得到要转换的数组---当然这里也可以是其他类型的数组

List jsList = (List) request.getAttribute("gczbh")

JS 代码如下：

function initPages()

{

var codes = new Array()

// 将JAVA中的数组转换成JS 的数组

if(jsList!=null)

{

for(int i=0i<jsList.size()i++)

{

codes[<%=i%>]='<%=jsList.get(i)%>'

<% }

}

</script>

JavaScript有两种地方存在，一是在页面就写出来的，二是引用的。

1.直接写出来的，一看就明白（右键->查看页面源代码）

2.引用的，就比如说这个页面吧，其中有下面代码：

<head>

</script>

</head>

通过这段代码（src="/userlogin.js?213"）知道他引用的位置是http://zhidao.baidu.com/userlogin.js,输入这个网址看看效果，就是document.domain="baidu.com"document.write("等等，这就是他引用的JS了。

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：如何防止js和css缓存

# 下一篇：电脑输入法怎么切换

给您推荐相同类型的内容：

js怎么把数字金额转换中文大写金额
代码如下所示：function convertCurrency(money) { 汉字的数字 var cnNums = new Array('零', '壹', '贰',
js或者css能控制页面输入框点击后自动切换英文输入吗？
直接设置，输入框只能输入数字或密码就行。代码如下：&ltinput onKeyUp="value=value.replace([^a-zA-Z]g,'')"&gt方法很多种，
为什么js的手册里没有window document等对象的资料？
js的语言率属于ecmascript，是纯语法内容的介绍，比如String,Array等等一堆东西window,document,getElementById这些属于浏览器的DOM，当javascript在浏览器中运行的时候，浏览器属于宿主
css盒子模型及盒子模型的类型
转自菜鸟教程所有HTML元素可以看作盒子，在CSS中，"box model"这一术语是用来设计和布局时使用。 CSS盒模型本质上是一个盒子，封装周围的HTML元素，它包括：边距（外边距），边框
怎样用css写出圆形边框
1、首先打开sublime text编辑器，新建一个html文件，里面写入一个p标签：2、然后设置p标签的样式，这里先设置一个边框，然后设置圆角边框，主要使用CSS3属性border-radius属性定义圆角效果。其中的数值为参数lengt
电脑防火墙怎么打开
在桌面左下角点击开始，选择控制面板，在网络和Internet下点击查看网络状态和任务，选择Windows防火墙，点击打开或关闭Windows防火墙，根据需要选择打开或关闭，确认。防火墙就是在外网和用户电脑之间设置防火墙。防火墙也可以是用户
用html做的一个form+table注册页面里有一个验证码，要怎么写这个js代码？？
可以用JS做个简单的验证码 &ltscript language="javascript"&gtvar code在全局定义验证码function createCode(){ 创建验证码函数 co
C语言好还是C++好
C与C++的最大区别:在于它们的用于解决问题的思想方法不一样。之所以说C++比C更先进，是因为“设计这个概念已经被融入到C++之中”，而就语言本身而言，在C中更多的是算法的概念。那么是不是C就不重要了，错！算法是程序设计的基础，好的设计如果
怎么样下载js
你是要下载HTML网页中的js么？用chrome访问网页，viewsource查看网页源代码，找到要下载的js文件，点击就打开了，然后拷贝或者另存就行。浏览器都有查看网页源代码功能的是完全可以查到的，但正常情况下不会bai去帮你查,需要先去
利用js中的冒泡，把对象中的进行排序
var arr = [{ name:"张三1", shuxue:98, yuwen:34, yingyu:89},{ name:"张三2", shuxue:56,
利用CSS border实现三角形图标效果及原理解释
在日常开发中，经常会用到各种形状的三角形，我们可以通过图标来实现自己先要的效果，但如何用样式快速写出一个适合自己的三角形呢，如果你不太明白请看接下例子。结果如下：这样简单的4个不同方位的三角形就做好了，其实实现三角形很简单，为
H5用神策数据实现埋点(使用原生或者jq)
1.先引入sensor.js文件 2.全局引入使用sensor 3.点击按钮进行埋点 4.在进入页面的时候会自动触发一个'pageView'事件，点击按钮会触发'webClick'事件参考
Js表单提交
表单提交是刚开始学js的朋友很迷惑的一个问题，怎么提交，怎么阻止默认提交，怎么提交表单不跳转等等问题，下面是一些示例原始的表单提交有 button 按钮提交和 &ltinput &gt类型的。它们又什么区别呢？
手机怎样在电脑上登录微信
在电脑上登录微信的方法如下：双击桌面的微信图标，运行微信。如果是第一次登录，会出现二维码。打开手机微信的扫一扫，扫码登录；扫描后，在手机上点击确认以登录；在手机上打开微信，出现登录确认界面，点击登录，可以开始使用。如果不是第一次登录，运行微
k-means聚类算法的java代码实现文本聚类
K-MEANS算法:k-means 算法接受输入量 k ；然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引
Node.js node-schedule定时任务隔多少分钟执行一次的方法
参考代码： var schedule = require('node-schedule') var rule = new schedule.RecurrenceRule()每隔 30 分钟执行rule.minut
js如何设置div的宽高
&lt!DOCTYPE html&gt&lthtml lang="en"&gt&lthead&gt&ltmeta charset="UTF-8&qu
如何用css实现网页的动态效果
网页的动态效果你说的这里的动态效果是让一个画面或者文字动一下吧？因为在专业里边动态是与数据库连接的后台的技术。css是层叠样式表，是不能够实现动态效果的。但是可以让某个画面动，比如：一个文字点击的时候，变大的css代码为：a{font
js中平级数组和树形结构数据相互转换
在实际的工作和业务需求中，我们经常会碰到树形数据结构，比如公司组织架构、组织层级、省市县或者事物的分类等等数据。那么在JavaScript中如何将数组转为树形结构和树形结构转为数组，本文就详细的来探究一下。先来看看给出了一组怎样的数
如何使用JS实现一个简易数码时钟
设计思路：数码时钟即通过图片数字来显示当前时间，需要显示的图片的URL根据时间变化而变化。a、获取当前时间Date()并将当前时间信息转换为一个6位的字符串b、根据时间字符串每个位置对应的数字来更改图片的src的值，从而实现更换显示图片构建
CSS是什么?和HTML有什么区别?
一、css是Cascading Style Sheets 的缩写,即层叠式样式表单，它是由W3C协会制定并发布的一个网页排版式标准,是对HTML语言功能的补充。二、HTML和CSS的区别?1、定义不同：html是HyperTextMa
怎样用css写出圆形边框
1、首先打开sublime text编辑器，新建一个html文件，里面写入一个p标签：2、然后设置p标签的样式，这里先设置一个边框，然后设置圆角边框，主要使用CSS3属性border-radius属性定义圆角效果。其中的数值为参数lengt
js中怎么获取当前年份、月份和日期
JS有自带的日期函数，获取如下：var date = new Date()var year = date.getFullYear()获取年份var month = date.getMonth()+1获取月份，因为是从0-11所以要+
收音机声音小是什么原因
收音机声音小的原因有：1、信号不好。可以通过改变方向和拉出天线解决问题。2、电池没电了。可以通过更换碱性电池解决问题。3、电路问题。就是收音机本身质量有问题，可以考虑让厂家更换。4、扬声器老化。扬声器的磁铁消磁了，可以更换扬声器解决问题。
前端自动化测试框架Jest 基础入门-
　一、引言前端这几年发展的非常迅速，我们的系统的功能正在变的越来越复杂，这对我们的前端工程化能力提出了更高的要求，听到工程化，大家的第一反应肯定是高质量的代码设计和高质量的代码实现。但实际上，前端自动
苹果电脑怎么安装win7驱动试试这样做吧
1、进入Mac OS操作系统，使用无线网络进行宽带链接。2、在苹果电脑桌面的应用程序列表中找到实用工具，继续下一步。3、使用工具列表中找到Boot Camp，在苹果air装windows7操作系统之前，提前下载好win7驱动程序。在
for( i = 0 ; i <= 24 ; i++){ $("p").eq(i).css({"top"：parseInt(i5) * 82，"left"：i % 5 * 194})
这是把25个元素排成5行5列的方阵。parseInt(i5) 是计算每个元素的行号，当i=0到4时，parseInt(i5) 的值是 0，表明0到4这5个元素是第1行，当i=5到9时，parseInt(i5) 的值是 1，
Date对象
Date对象（日期对象）来实现对日期和时间的控制。日期对象是对一个对象数据类型求值，该对象主要负责处理与日期和时间相关的数据信息。在使用Date对象前，首先要创建该对象。语法：下面以示例的形式来介绍如何创建日期对象。例子
区块链技术入门，涉及哪些编程语言
Go语言Go语言（Golang）是谷歌2009年推出的一种全新的编程语言，可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说：“我们之所以开发Go，是因为过去10多年间软件开发的难度令人沮丧
电脑上中间点号怎么打
问题一：中间的点在电脑上怎么打出来？就是键盘上最左上角那个键和“~”是同一个键，要在中文输入法状态下，中文标点状态下。问题二：电脑上中间一个点的标点符号怎么打出来？你切换到中文输入法状态，输入法标识上有一个类似于键

推荐阅读

热门文章

最新发布

标签列表

java爬虫怎么抓取js动态生成的内容

给您推荐相同类型的内容：