如何用python爬取js动态生成内容的页面

2023-02-20 22:05:02JavaScript012

如何用python爬取js动态生成内容的页面,第1张

抓取js动态生成的内容的页面有两种基本的解决方案

1用dryscrape库动态抓取页面

js脚本是通过浏览器来执行并返回信息的，所以，抓取js执行后的页面，一个最直接的方式就是用python模拟浏览器的行为。WebKit 是一个开源的浏览器引擎，python提供了许多库可以调用这个引擎，dryscrape便是其中之一，它调用webkit引擎来处理包含js等的网页！

2 selenium web测试框架

selenium是一个web测试框架，它允许调用本地的浏览器引擎发送网页请求，所以，它同样可以实现抓取页面的要求。

对于这种动态加载的网站，建议使用第三方库selenium爬取。

它可以完全模拟浏览器，等待网站全部加载完成后再进行数据的自动获取。

对于主流的ChromeDriver、InternetExplorerDriver、FirefoxDriver、OperaDriver都支持，网站上的元素也支持多种选择器，如class、id、xpath等。

但是用习惯以后，对于这种非纯静态页面，离开selenium感觉就完全不会爬虫了。

不是爬不到

是因为用js生成的网页，是通过浏览器加载js代码之后，由js动态生成的。

用爬虫直接去抓网页的话，抓下来的是原始代码，浏览器还未解析过的内容。

纯 html 的话，抓下来可以直接拿来用，但是如果是由 js 动态生成的网页的话，就没办法直接用了。

像通过js动态加载的网页，理论上如果能用开源的浏览器内核将网页解析出来的话，通过浏览器内核提供的接口，完全可以把网页最终的 html 拿出来

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：电脑音响怎么接线？

# 下一篇：CSS3 如何实现菱形

给您推荐相同类型的内容：

js命名规则
函数命名：统一使用动词或者动词+名词形式 ---- fnInit() 如果有内部函数则“_”开头 _fnInit(). 对象方法命名使用fn+对象类名+动词+名词形式 fnAnimateDoRun() 某事件响应函数命名
网络电视机顶盒怎么连接电脑
很多智能电视盒子都可以直接连电脑显示器看电视，其实方法是很简单的，下面是我给大家整理的一些有关网络电视机顶盒连接电脑的方法，希望对大家有帮助!网络电视机顶盒连接电脑的方法用对应的线将WEBOX的各个接口与电视
C语言jpg解码问题（文件读取）
mgdecmp库是WINCE 系统提供一个解码BMP,GIF,PNG,JPG的文件的库,这个库的缺陷是不能解出MASK 图片.具体用法如下:1.把imgdecmp.h加入工程,imgdecmp.h文件内容如下:*-------------
用电脑解手机锁屏密码忘了怎么办
1. 手机锁屏密码忘了怎么用电脑解锁安卓解决办法：1、关机状态长按开机键和音量+进入recovery。2、在recovery模式下选择两个wipe清理。3、不同手机的按键不同，自己测试一下就好。双wipe以后手机信息是完
关于Javascript 特效代码
&ltscript language="JavaScript"&gt&lt!-- Hide the script from old browsers --function compute(obj)
怎么折纸电脑
方法步骤1将长方形彩纸长边部分上下对折怎么用纸折电脑2再左右对折，继续对折，两次展开怎么用纸折电脑怎么用纸折电脑怎么用纸折电脑再将上面折出的小长方形沿着中间对折一下怎么用纸折电脑中间沿着折出的痕迹往上折出一块，如图怎么用纸折电脑怎么用纸折
在JAVA中线程到底起到什么作用
这是javaeye上非常经典的关于线程的帖子，写的非常通俗易懂的，适合任何读计算机的同学. 线程同步我们可以在计算机上运行各种计算机软件程序。每一个运行的程序可能包括多个独立运行的线程（Thread）。线程（Thread）是一份独立运行的
CSS在线优化工具和在线压缩工具的区别是什么? 求大神。。
CSS的优化通常包括两方面: 格式化CSS和精简CSS。精简CSS的办法是把具有相同属性的元素合并在一起，但这会降低代码的可读性，使代码的后期维护很麻烦，稍不注意就出错。格式化CSS一般就是多行模式或单行模式的选择，比如我个人就完全受不了多
js怎么加多个函数 function houvef
js加多个函数 function houvef：可以将多个函数放入一个函数中，如下：fun(){fun1(){}fun2(){}}然后调用fun()可以，for循环里面可以填入任何的函数语句事件，具体例子如下：for循环给class=
JS怎么调用API接口
需要准备的材料分别是：电脑、html编辑器、浏览器。1、首先，打开html编辑器，新建html文件，例如：index.html，引入jquery使用。2、在index.html的&ltscript&gt标签中，输入js代码
苹果电脑如何更改用户?
问题一：苹果笔记本，请问怎么改用户名？1、打开系统偏好设置-用户与群组； 2、解开左下角的锁（需要你有管理员权限）； 3、对着当前用户中的“pg”右键-高级选项...； 4、将个人目录的Userspg改成Users你
请教如何在vue中引入自己写的js文件
比如说我在srcutil下面有一个rem.js的文件，写成自执行函数(function(doc, win) {var docEl = doc.documentElement,resizeEvt = 'orientationcha
前端里面node.js和vue.js区别是什么？
两者的区别是：一个是服务端语言，一个是前端框架。1、nodejs是一个js运行于服务端的环境，是一个服务端语言；而vue是前端渲染的库，是一个前端框架。2、Node用于方便地搭建响应速度快、易于扩展的网络应用；3、而vue用于实现响应
.net是什么语言？
.net是微软新推出的一种编程框架理论。NET语言的全称应该是ASP.NET，是微软新推出的一种编程框架理论或者说是一种编程标准，它可以通过微软出品的Visual Studio 开发工具进行项目开发，应用于网站类的开发一般使用C#语言进行
js数组操作（添加、删除、替换元素）
1、添加元素函数：push(para)，参数说明para要添加的元素示例： var lang = ["php","java","javascript"] lan
如何在IE中调整CSS字体的大小
启动IE，单击“工具→Internet选项”，出现“Internet选项”对话框，在“常规”标签中单击右下方的“辅助功能”按钮，在出现的“辅助功能”对话框中把“不使用网页中指定的字体大小”选项选上，按“确定”退出就可以了！现在，你再试试“查
JS 判断显示内容请教
写几个div嘛他们的名字分别是 div1 div2 div3然后根据你设置一个东西或是点击，或是其他的$("#div1").show()$("#div2").hide()$("#div3
CSS的样式有哪些？
什么是CSS样式层叠样式表（CascadingStyleSheet，CSS）是一系列样式或格式规格的集合，用于控制网页样式并允许将样式与网页内容分离的一种标记性语言。它是W3C组织用于改善HTML在显示网页方面的缺陷。虽然HTML在发布时
怎样才能把我的苹果手机和我的电脑连接
将苹果手机与电脑连接，步骤如下：1、首先打开http:www.apple.comcn到苹果官网上，点击苹果官网页面栏目上的”iTunes“进入页面。接着点击iTunes下载按钮，下载苹果iTunes软件并安装到电脑上面；2、iT
c语言面试经常问到的问题有哪些?
c语言面试经常问到的问题有：1、C语言的主要特征是什么？C是一种过程语言。C语言的主要功能包括对内存的低级访问，简单的关键字集和简洁的样式。这些功能使其适用于诸如操作系统或编译器开发之类的系统编程。2、i ++和＋＋i有什么区别？1）
联想电脑重置后怎么办
1. 联想电脑恢复出厂设置步骤关机状态下，按一键恢复键所示图标进入一键恢复主界面选择：“从初始备份恢复”可以把系统恢复到出厂状态，单击：“下一步” 点击开始（恢复过程中一定要接电源适配器，如果电池没电会导致一键恢复无法使用
js舞蹈培训机构怎么样？
缴费才三个小时，一节课没上，就要扣40%违约金，这有道理吗？10月8日，市民小王就遇到这样一个经历。她花了6480元，在“JS舞蹈”金牛凯德店报名了舞蹈课程。然而，缴费三个小时后，小王发现自己年底将搬的新家，距离这家机构的分校都比较远，便提
JS处理两个数组，数组A有a，b，c，d四个值数组B有a，c两个值，处理后新的数组为b，d值
以int类型数组对比为例import java.util.ArrayListimport java.util.Listpublic class ABC {public static void main(String[] args) {int
Chrome中css失效，F12看到这个css是空白的
你好，看一下这个css路径是否引用正确了。即使css写的不规范或者错误，css只要加载了，代码还是会有的，不会空白的。首先，css规定，每个元素都有display属性，确定该元素的类型，每个元素都有默认的diaplay值，如div的dis
电脑屏幕横屏了怎么转换
您可以直接在电脑上使用【Ctrl】+【Alt】+方向键的上或者下快捷键进行调节。也可以在桌面空白处右键选择【图形】-【旋转】选项完成调节。您还可以在右键打开的菜单中选择【属性】-【高级】-【旋转】中调整旋转的角度。1、使用快捷键的方式，【C
java开发前台与后台都指什么，要浅显易懂的。
java开发前台通常指的是开发界面，用到的技术：html5，jsp，js ，css，jquery，easyui等。java后台开发就是普通意义上的java代码开发。学java开发推荐千锋教育。千锋智能AI技术实时监课和回顾，对授课行为数据进
js的重载
问：什么是重载？答：同样的函数，不同样的参数个数。《JS高级程序设计》里是提到过函数是没有重载的，ts中有重载。但是可以根据arguments的长度来实现重载。最后定义的fn将前两个fn覆盖掉，所以没有达到重载的效果
Js750双卧轴强制式搅拌机配置参数价格怎样
双轴保温砂浆搅拌机，按物料在料槽中运送方向的不同，可分为相对和相反两种双轴搅拌机。相反双轴搅拌时，两根主轴转向相反，螺旋搅拌刀的旋向也相反，物料沿同一方向并流前进。相对双轴搅拌轴搅拌时，两根主轴转向相反，但螺旋搅拌刀的旋向相同，物料一去一回
杭州js招募中心是劳务派遣吗?
是的。由杭州js招募中心发布的公示信息可知杭州js招募中心是劳务派遣。劳动派遣是指劳务派遣单位与被派遣劳动者建立劳动关系，并将劳动者派遣到用工单位，被派遣劳动者在用工单位的指挥、监督下从事劳动的新型用工形式。靠谱。南宁js舞蹈培训中心位于广
js实现效果：循环轮播图
跟普通的左右切换轮播图类似，但是它看起来是首尾相连的。首先来讲一下我的思路：我们要想无缝切换图片，必须要在所有图片的最后添加一张第一张图片，因为要实现从最后一张切换到第一张时有过渡效果；之后我们要让你处在第一张时，向前向

推荐阅读

热门文章

最新发布

标签列表

如何用python爬取js动态生成内容的页面

给您推荐相同类型的内容：