java爬虫怎么抓取js动态生成的内容

2023-02-19 16:27:02JavaScript038

java爬虫怎么抓取js动态生成的内容,第1张

我用Jsoup写爬虫，一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。

1、有些页面元素被隐藏起来了->换selector解决

2、有些数据保存在js/json对象中->截取对应的串，分析解决

3、通过api接口调用->伪造请求获得数据

还有一个终极方法

4、使用phantomjs或者casperjs这种headless浏览器

通过使用window.location.search可以获取到当前URL的?号开始的字符串，如前面的链接获取到的search为?id=001，再对获取的字符串进行处理，就可以获取到参数的值了，参考代码如下：

<SPAN style="FONT-SIZE: 14px">function getUrlParam(name) {

var reg = new RegExp("(^|&)" + name + "=([^&]*)(&|$)")

var r = window.location.search.substr(1).match(reg)

if (r != null)

return unescape(r[2])

return null

}

</SPAN>

在调用上面的方法的时候，只要传入参数的名称，就可以获取到想要的参数的值了，如:getUrlParam("id")。

1、WebView 在没发出一个请求前，会调用如下方法，

可以尝试在这里处理。

-[NSURLCache cachedResponseForRequest:]

2、再就是看看能否使用 NSURLProtocol 拦截。

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：怎样将电脑视频传到苹果手机

# 下一篇：我的世界电脑版怎么和手机版我的世界联机

给您推荐相同类型的内容：

用js输出jsp标签
你这个需要用ajax的方式实现，代码如下，如有疑问请追function createXMLHttpRequest(){if(window.XMLHttpRequest) return new XMLHttpRequest()try{retu
购买电脑需要注意什么
如今电脑几乎成为家家必备的产品之一，而当我们买电脑时，有什么需要注意的呢。下面是我整理的购买电脑的注意事项，分享给大家! 购买电脑的注意事项1、明确用户需求购买电脑之前，首先要确定用户购买电脑的用途，需要电脑为
css文件里全局的样式.想排除其中某一个元素怎么写
没有通用的办法。CSS3选择器里面有 :not 伪类型选择器，比如设置页面除了&lta&gt标签之外所有元素的color为红色：*:not(a) { color : red }1、先确保代码没有错别字；2、提升这个选择器
CSS3边框与圆角
属性：一个最多可指定四个border-*-radius属性的符合属性，这个属性允许你为元素添加圆角边框！语法：border-radius:1-4 length|%1-4length|% 【length可为任意长度单位，比
哪里买笔记本电脑便宜
去网上电商里面购买。京东、易讯、苏宁易购、国美电器网上商城中自营的笔记本其实是做的最好的，价格透明也比较优惠、款式比较齐全，缺点是看不到实物样机。买电脑去哪个平台如下：第一种渠道，在某宝网购电脑。第二种渠道，在某宁易购网购电脑。第三种渠道，
CSS3动画
transform不会使DOM脱离文档流，当通过translateX等属性值移动了元素后，它仍然占据原来的位置。好处是， transform制作的动画会直接进入合成阶段，避开重排重绘，可以通过Performance
如何才能彻底删除电脑使用记录？
1.清除最近使用过的文档记录以Windows XP为例，右键点击“开始”按钮，选择“属性”，在弹出的设置任务栏和开始菜单属性对话窗中点“自定义”按钮，在“自定义开始菜单”对话框中的“高级”标签下点“清除列表”。若要让系统永不自作多情记住使用
如何查看自己电脑的PIN 码?
查看电脑的PIN码的操作步骤如下：1、在浏览器里输入路由器的ip地址，点击回车键。2、进入页面后，需要输入路由器的密码，登录进去。3、进入页面，点击「一般设置」。4、然后点击设置页面下的「网络地图」。5、在网络地图页面，点击右边系统信息下
台式电源怎么选联想电脑
联想品牌机出厂原配的电源一般都是台达、航嘉等大厂的，但功率一般都很小，就250W这样的，没有留余量，自己加个新的独立显卡就会拖不动。所以换电源建议配个正规品牌的400W左右的电源（最好带铜牌以上认证），注意和机箱大小适配（联想有些小机箱是用
电脑常用字体有哪些？
电脑常用字体有很多，标准系统安装时自带常用字体汉字主要有：宋体、仿宋体、黑体、楷体等。电脑系统字体在安装WORD等文字编辑软件时还会自动添加新的字体，如方正姚体，行楷等字体等。需要的特殊字体，电脑系统可以随时添加和删除。1、查看电脑系统常用
电脑esc是什么意思键盘上的ESC是什么意思
1、键盘上的esc它是英文单词escape的缩写。键盘上的esc它是英文单词escape的缩写,在电脑上指的是取消和退出的意思。比如你打开了一个应用程序，当你需要中断程序运行的话可以按esc中断，这里的esc也是代表中断的意思。 2、【
电脑显示器什么牌子好？电脑显示器品牌有哪些？
三星、AOC、HKC、优派、飞利浦、明基、戴尔、华硕、LG、航嘉等。显示器的牌子有很多，但是好的就那么几个，不但售后强大面板也好，戴尔显示器一直都是显示器中的巨擘，显示效果非常出色，色彩还原很好，色域非常广，售后很好，出问题三年上门换新。有
3000元的电脑配置清单有哪些?
配置一：3000元左右台式电脑配置清单CPU：R5 3500X原盒880散热：酷冷至尊T400 90主板：微星B450M A PRO MAX 499内存：十铨16G 2666 DDR4 360固态：西数SN550 250G NVME 339
js投票，不用数据库
数据库和JS不矛盾，不是干一个事的，这里依然可以用数据库也可以不用，也许也只是用到编程语言里的作用域，并且这里到可以不用JS，我假设这是用JSP写的，那么数据就可以存放在application作用域中，每点击一次发一个请求，然后从该作用域中
电脑锁屏了怎么解
重新启动电脑，启动到系统登录界面时，同时按住Ctrl+Alt键，然后连击Del键两次，会出现新的登录界面，用户名处输入“Administrator”密码为空，回车即可登录，登录后，打开控制面板选用户账户更改账户点击原来的“账户名”更
请根据以下内容提示，写一篇英语短文介绍电脑的用处。内容包括: 1.你每天都用电脑。 2.在电脑上
It is known to us all that the computer is the most important invention in the 20th century. It has been developed a lot
在wegame下载完cf之后电脑上带盾牌的图标就打不开了
需要管理员权限打开。根据查询相关信息显示，在wegame下载完cf之后电脑上带盾牌的图标是系统保护，需要用管理员身份打开，对系统没有影响的。WeGame是腾讯游戏平台的升级版本，该平台面向全球及国内玩家，直接将游戏开发者与用户连接起来，为两
JAVA数据结构有哪几种？
数组、栈、队列、链表、树、堆、图、散列表。1：数组是计算机编程语言上，对于“Array”的中文称呼，是用于储存多个相同类型数据的集合。2：栈是限定仅在表尾进行插入和删除操作的线性表，栈者，存储货物或供旅客住宿的地方，可引申为仓库、
玩游戏用什么笔记本电脑好？
玩游戏用灵越游匣Master 15 7000、三星玄龙骑士、联想拯救者R720、惠普（HP）暗影精灵4代、华硕飞行堡垒五代FX80GM（星途灰）。1、灵越游匣Master 15 7000游匣系列游戏本作为戴尔经典的游戏本品牌，自从推出以
打印快捷键是什么
word 文档中打印的快捷键是Ctrl+P。1、电脑打开打印的word文档。2、电脑打开打印的word文档后，按打印快捷键Ctrl+P。3、按打印快捷键Ctrl+P后，就可以进入打印页面，点击打印就可以了。键盘上打印键是组合键，为Ctr
碳晶门冰川白和珍珠白有什么区别
一个冷色，一个暖色。冰川白，有着纯净的质感，把人们从大红大绿中解脱出来，呈现出最高级别的灵魂世界。属于冷色调。珍珠白：米白，有光泽，加了云母片，抗氧化性较强，不容易变黄，属于暖色调。碳晶门就是以这种碳元素晶体为原材料，再经过特殊工艺加工制作
css用背景图片制作导航栏分割线
首先，一般做导航条，都是通过ul、li来做，将ul包裹在一个div中，然后设置好width和height，分隔线，换个理解，给li一个右边的边框就可以了，通过代码来理解：&lthtml&gt&lthead&g
js 不修改原数组，返回新的数组
根据javascript高程第四章变量、作用域和内存问题 4.1 基本类型和引用类型的值 1）基本类型值指的是简单的数据段（Undefined、Null、Boolean、Number 和 String） 2）引用类型值指那些
etc是什么？
电子不停车收费系统ETC是Electronic Toll Collection 的缩写，是指车辆在通过收费站时，通过车载设备实现车辆识别、信息写入（入口）并自动从预先绑定的IC卡或银行帐户上扣除相应资金（出口），是国际上正在努力开发
js可以实现修改用户头像功能吗
在之前的笔记中，讲了如何实现圆形头像，这里接着上一次的笔记，讲一下怎么修改头像（通过图库和拍照方式）。重点：流程：一般在APP中，修改头像是最基本的功能之一了。一般是两种方式的修改：从相册选择图片或者拍照。那么这里就来讲一下如何具体实
现在还有什么币可以用普通电脑挖矿得到
某些新生的虚拟数字币可以用电脑的算力挖矿得到，如ETH、ZEC、门罗币、XRB等。因为这一类币需求的全网算力不高，个人电脑的算力进行哈希碰撞的概率可以在短时间内碰撞出答案，从而获得区块奖励，但这类代币普遍没啥价值，或者没有风险极高，因此，
一个logo很像奔驰的电脑
是联想拯救者。是联想公司2015年06月上市的14英寸游戏影音本，搭载第四代酷睿双核四核处理器，GTX 9系列显卡，杜比音认证音效，支持蓝牙功能。共有4款产品。4GB（4GB×1）1TB不支持触控1920x1080FHD，LED
css+div布局，左右两个div怎么能自动适应高度
可以通过js实现两个div自适应同等高度，如下：先设置div+css 基本布局：&ltdiv id="mm"&gt&ltdiv id="mm1"&gt左边&l
电脑单机小游戏有什么
1、《跳转骑士（Jump Warrior）》是一款RPG，玩家通过控制英雄跳跃斩杀魔物，积攒金币兑换装备提升属性，还有限时模式、大师模式等你来挑战。精确是这个游戏唯一的要求。2、《折纸教室III》这款OrigamiClassroom，以步骤
室内设计专业用什么配置的电脑用CAD 3D MAX PS等软件不卡，能流畅运行
答：平面设计是二维制图不同于3D制图，它对CPU、内存、硬盘三大件配置要求要高，CPU必须是多核心多线程，越多越好，同时要求CPU的主频尽可能的高；内存的容量要大，最低8GB，最好16GB或32GB；用7200转硬盘，最好是固态硬盘。平面

推荐阅读

热门文章

最新发布

标签列表

java爬虫怎么抓取js动态生成的内容

给您推荐相同类型的内容：