如何用python爬取js动态生成内容的页面

2023-02-19 17:24:01JavaScript0128

如何用python爬取js动态生成内容的页面,第1张

抓取js动态生成的内容的页面有两种基本的解决方案

1用dryscrape库动态抓取页面

js脚本是通过浏览器来执行并返回信息的，所以，抓取js执行后的页面，一个最直接的方式就是用python模拟浏览器的行为。WebKit 是一个开源的浏览器引擎，python提供了许多库可以调用这个引擎，dryscrape便是其中之一，它调用webkit引擎来处理包含js等的网页！

2 selenium web测试框架

selenium是一个web测试框架，它允许调用本地的浏览器引擎发送网页请求，所以，它同样可以实现抓取页面的要求。

我用Jsoup写爬虫，一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。

1、有些页面元素被隐藏起来了->换selector解决

2、有些数据保存在js/json对象中->截取对应的串，分析解决

3、通过api接口调用->伪造请求获得数据

还有一个终极方法

4、使用phantomjs或者casperjs这种headless浏览器

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：新电脑装机选什么样的电源？

# 下一篇：电脑上怎么截图按什么键

给您推荐相同类型的内容：

如何在DW设置文字居中
如何在DW设置文字居中工具原料电脑DW方法步骤1首先打开电脑桌面上的DW软件2在打开dw界面，点击新建下的“html”新建空白网页3在空白的网页上输入一段文字4在属性栏下方点击“CSS”选项，然后点击右侧的居中对齐选项5会跳出提示页面
css中,ul和li,做新闻列表,每条新闻前要有图标,请问代码如何编辑?还有就是每天添加的新闻后面有个NEW。
1.每条新闻前要有图标不知道图标是不是一样的，还是1.2.3……这种排名形式·如果图标都是一样的，那就切一个小图标，作为li的背景，也可以设置list-style-image:url()差不多就这两种方法·如果图标不一样，就把这些图标竖
js随机抽奖一二三等奖不重复的抽奖逻辑怎么设置
&lt!DOCTYPE html&gt&lthtml&gt&lthead&gt&lttitle&gtjs随机抽奖一二三等奖不重复的抽奖逻辑怎么设置&lttitl
html 怎么改变文件上传的样式
input file的样式很难改变，你可以用js控制一个div触发input file，把样式写在div上，把input file隐藏就可以了；代码如下：&ltscript&gtfunction clp(){return
如何用js在特定位置动态添加html？除了innerHTML。。
js在特定位置动态添加html可以利用HTML DOM appendChild() 方法。例子：var div1 = document.createElement("div")div1.id = "div1&q
笔记本电脑摔在地上会坏吗？
笔记本电脑摔到地上会坏。如果笔记本电脑掉地上后，笔记本电脑依然能够工作正常，只是外壳有磕碰痕迹的话，那么被摔的笔记本电脑问题不大，里面的零件依然可以正常运作。第二种情况比较严重一点，一般会摔坏笔记本电脑的键盘，由于笔记本电脑受到外力冲击，
直接删除电脑上的应用程序有什么结果?
直接删除会产生垃圾碎片，注册表垃圾文件增多，使电脑运行时出现碎片整理。添加删除面版：在隐藏和禁止使用“控制面板”时，我们可以在开始菜单中的运行栏中输入regedit命令，打开注册表编辑器操作界面，然后在该界面中，依次用鼠标单击\\HK
怎样复制表格
如何复制excel表格应该有很多种意思和层次在里面：1、如果只复制数值：可以点击左上角的全选，复制，-粘贴，就可以把全部数值复制到新的表内，这样只复制的数值（包含公式）和边框，但还要自己调整。2、完全复制：意思是复制出一张完
电脑系统装机哪个系统好呢？
你好，我做了多年IT维护，在生活工作中经常有人问我这个问题。正好今天碰到这个问题，我就回答一下。电脑能装什么系统，这个跟电脑硬件自身硬件有很大关系，系统属于软件，硬件是软件的底层，没有硬件支持，就无法加载软件。那么都有什
组装电脑怎么开票
第一种：按给中配件详细内容开票第二种：就是只开其中一个配件的票第三种：如果店铺支持按组装电脑开票，那么开票内容就写组装电脑第四种：就是开其他内容了，金额不变就行买电脑开的是专用发票。经查询会计网，供应商是增值税一般纳税人，可自行开具税率为1
如何让图片和文字分列两边设定css
、在div中，使用p标签创建一行文字，使用img创建一张图片。2、设置div标签的class属性为mydiv。3、在css标签内，通过class设置div的样式，设置它的宽度为400px，边框为1px，并将display属性设置为flex，
R语言数据对象与运算
R语言数据对象与运算R语言数据对象与运算笔记整理2.1 数据对象及类型R语言创建和控制的实体被称为对象（object）ls()命令来查看当前系统里的数据对象R对象的名称必须以一个英文字母打头，并由一串大小写字母、数字或钟点组成注意：R区分
快手搜索不了怎么回事
品牌型号：vivoY73s系统：Funtouch OS_10.5软件版本:快手9.6.51.20947 以快手9.6.51为例，有可能是网络异常导致，重新连接信号强的WIFI尝试。分为3步，步骤如下： 1设置中重新连接网络&lt
JSJquery，如何实现背景图片的更换
更换背景图片有两种方式：1、直接给元素附加css，因为js附加的css样式要比css中的样式权限高，那么js设置的背景图片就会覆盖之前的图片$(this).css("background","url(1.jpg
电脑总是弹窗很黄的广告，怎么永久禁止？
如果要问大家在使用电脑的过程中让人最反感的是什么，我想许多人的回答都会是弹窗广告。一些软件为了给自己创收，完全不顾用户的使用体验，在软件中强行加入广告弹窗模块。这些弹窗广告不仅让人在视觉上烦不胜烦，而且还会拖慢电脑的运行速度。接下来，小雨就
计算机网络中常用的有线传输介质有
有线传输介质1、双绞线常用点到点连接，也可用于多点连接。可以用于传输模拟或数字信号，与其他传输介质相比，双绞线在传输距离，信道宽度和数据传输速度等方面均受到一定限制，但价格较为低廉。常作短程传输介质。2、同轴电缆可用于点到点连接或多点连
装机调取校验码时,显示"PU”,其含义为:接错线故障?
确定“PU”代表接错线的话，就要先去排查所有的电气接线状态。先给机组断电，找到电控盒盖板背面张贴的或在产品安装使用说明书里面所给出的电气接线图，对照电气接线图仔细排查所有的电气接线，重点是安装过程中完成的接线部分，包括强电线、弱电线和通信线
已经成为手机标配的OLED屏，为何在笔记本电脑上很少使用？
OLED屏幕显示效果更加艳丽，色饱和度更高。它采用的是自发光的原理，并不需要背光参与，所以可以做得更轻薄。OLED屏幕拥有很多先天性的优势，比如：LCD屏幕发展了多年才完善广视角技术，而OLED屏幕天然就支持广视角。另外色彩表现上，LCD量
js开头的密文是什么
如果是定长的都是8位的话,这里就可能是一种单向加密的方式,而就是说,只存在从明文向密文进行的一个加密过程,不存在一个由密文向明文的解密过程,这种单向加密又称非可逆性加密,多用于校检式对比.校验显然不须要知道明文就可以了,所以采用的是单向加密
vb中的“shape”是什么？
vb中的Shape是图形控件，显示矩形、正方形、椭圆、圆形、圆角矩形或者圆角正方形。Shape控件属轻量图形控件，只支持 PictureBox 的属性、方法和事件的一个子集。因此，它们需要较少的系统资源而且加载也比 PictureBox 控
「配置」什么配置的电脑能玩文明5
推荐配置：Windows?? Vista SP27操作系统，1.8 GHz四核处理器，4GB物理内存，8GB硬盘空间，512MB ATI 4800512 MB nVidia 9800以上独立显卡，DirectX 9.0c兼容声卡
平板电脑怎么下载电视剧
首先需要在平板电脑上下载并安装“影视下载播放软件”，然后在平板电脑连接网络的情况下，通过影视网站点击“下载”，才能下载。产品劣势1、因为屏幕旋转装置需要空间，平板电脑的“性能体积比”和“性能重量比”就不如同规格的传统笔记本电脑。2、译码
手机u盘怎么在电脑上使用
头回见到这个界面。U盘插在手机上一般要有两个基本条件：1、手机要使用U盘的前提是，手机要支持OTG功能。2、手机要设置成U盘接收模式一般来说，现在的手机插上USB，都会提示是充电模式还是U盘模式的，可以插上USB线，试试看手机有没有提示说要
surfacepro3是三星屏吗
Surface Pro 3 是微软推出的一款触控笔记本电脑，不是三星屏。它是一款轻薄的笔记本电脑，具有12英寸的屏幕，采用了高分辨率的技术，拥有超高的分辨率，可以让用户更轻松地进行多种操作。它采用了Intel Core i5i7处理器，搭
电脑经常发出关键性停止的声音，怎么办啊？
打游戏时发生这样的现象，游戏会不会大退出来？就是打dota时会不会崩溃？会的话是电脑问题，是什么样的电脑，能说详细点吗？台机？笔记本？配置？等等。打游戏时，出现声音，但是不会大退出，只会卡顿或者只是跳转成桌面什么的，这就很多可能了，第一就是
兄弟们速来，鼠标接口用哪种好
鼠标接口有哪几种？鼠标接口类型是指鼠标与电脑主机之间相连接的接口方式或类型。目前常见的鼠标接口有串口、PS2、USB三种类型。1，串口就是串行接口，即COM接口。这是最古老的鼠标接口，是一种9针或25针的D型接口，将鼠标接到电脑主机串口上
java二维数组的初始化
你试试这样写:int[][] a=new int[3][]然后你可以定义三个内部的一维数组比如:a[0]=new int[]{0,1,2,5,6,7,8}a[1]=new int[]{4,5,2,3,1}a[2]=new int[]{9,1
在手机行业中，js是什么意思？
JS = Jian Shang，奸商，指代了一群特殊人群，他们通过倒卖游戏游戏中的各种装备材料等来获取丰厚的利润。现在JS更多用以指代现实中的奸商特别是攒机商，但是网友立场几乎一边倒地站在商家反方，于是无论商家好坏都叫JS。随着IT业发展，
如何用手机投屏到电脑上？
手机作为现在生活已经离不开的移动设备，但有时候手机屏幕太小，在观看影音，分享游戏视频的时候不能提供很深入的沉浸式体验，这时候如果能把手机的画面投影到像电脑等大屏设备上，就会带来更加震撼的效果，下面介绍一下手机投屏到电脑的方法步骤：1.打开
JS面试题：深浅拷贝简析手写深拷贝函数
对象类型在赋值的过程中实际上是复制了地址，从而导致了其中一方被改变其他也都被改变的情况，在开发中我们通常不希望出现这样的问题，这里可以使用浅拷贝来解决这个情况。首先我们可以通过Object.assign来实现浅拷贝，该函数只会拷贝所

推荐阅读

热门文章

最新发布

标签列表

如何用python爬取js动态生成内容的页面

给您推荐相同类型的内容：