如何用python爬取js动态生成内容的页面

2023-04-20 07:00:02JavaScript057

如何用python爬取js动态生成内容的页面,第1张

抓取js动态生成的内容的页面有两种基本的解决方案

1用dryscrape库动态抓取页面

js脚本是通过浏览器来执行并返回信息的，所以，抓取js执行后的页面，一个最直接的方式就是用python模拟浏览器的行为。WebKit 是一个开源的浏览器引擎，python提供了许多库可以调用这个引擎，dryscrape便是其中之一，它调用webkit引擎来处理包含js等的网页！

2 selenium web测试框架

selenium是一个web测试框架，它允许调用本地的浏览器引擎发送网页请求，所以，它同样可以实现抓取页面的要求。

对于这种动态加载的网站，建议使用第三方库selenium爬取。

它可以完全模拟浏览器，等待网站全部加载完成后再进行数据的自动获取。

对于主流的ChromeDriver、InternetExplorerDriver、FirefoxDriver、OperaDriver都支持，网站上的元素也支持多种选择器，如class、id、xpath等。

但是用习惯以后，对于这种非纯静态页面，离开selenium感觉就完全不会爬虫了。

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：js怎样修改cookie的domain

# 下一篇：房祖名演的电影房祖名演技最好的几部电影

给您推荐相同类型的内容：

js当输入4999时下图2倍显示的是元 3、4、5倍时显示单位“万”应该怎么做
就判断当前的值是不是&gt10000的，如果大于10000给将值除以10000就行了比如_money = 12999var str = _money + "元"if(_money&gt10000){_mo
如何用电脑连接监控
问题一：电脑怎么连接视频监控？这是一个简单的家庭监控的安装方法。 1.打开电脑机箱,在PCI插槽上面插上视频采集卡.然后把买采集卡时候送的碟子,也就是驱动软件放进光盘,安装视频采集卡. 2.把要安装的摄像头固定在你要安装的位置.
苹果手机怎么从电脑上下载铃声到手机里？
运用两个软件，轻松给苹果手机设置铃声工具原料:苹果助手（电脑软件）PP苹果助手（电脑软件）铃声多多（苹果手机软件）操作步骤：现在苹果手机上下载铃声多多软件，在该软件中下载自己喜欢的铃声。后再电脑上下载PP苹果助手、I苹果助手软件，将
如何用CSS样式控制文字浮于图片上方
1、首先，我们应该先给div设置宽度和高度，保证文字有一个范围。2、然后通过background给div添加一张图片作为它的背景。3、接着可以通过url()来连接图片，url里面放置的就是背景图片的路径。4、随意地放了一张图片用作背景，一定
jsp利用js验证手机号的整体流程是什么？
验证130-139,150-159,180-189号码段的手机号码，参考如下：x0dx0ax0dx0avar myreg = &#47^(((13[0-9]{1})|(15[0-9]{1})|(18[0-9]{1}))+&a
javascript 如何生成不重复的随机数
Math.random() 函数返回一个浮点, 伪随机数在范围[0，1)得到两数之间的随机数：function getRandomArbitrary(min, max) { return Math.random() * (max -
如何用JS计算分数排名
把所有分数放入一个数组中，就可以用数组排序的方法来排序&ltscript type="textjavascript"&gt function sortNumber(a,b){ re
怎么用CSS控制表单中的RADIO样式？
用label，例如：.add_cart_radio{ float:left margin-top:0.5em margin-right:0.5em}.add_cart_radio input[type="rad
电脑显示亮度怎么调？
电脑显示屏怎么调整亮度有以下两个方法：方法一：在windows7操作系统中其实进入电脑设置电脑屏幕亮度选项也非常容易，从开始-控制面板，点击系统和安全，点击电源选项，拖动滚动条调节屏幕亮度即可，当然也有更快得方法，直接同时按住Win+X组合
电脑一段时间不动就进入黑屏状态，并且断网，如何设置不断网？
设置不断网的方法步骤：1、以win7为例，右击“我的电脑”~~选择“设备管理器”，或者“管理”也能进入到“设备管理器”中；2、在设备管理器中的“网络适配器”找到自己的网卡。每台电脑可能不一样；3、右击，选择属性；4、在电源管理中，将
两数相加的总和JS自动计算代码怎么写？
我需要得到js实现两个数字相加的结果，可是js总是默认按照字符串处理，将两个数字连接起来。解决这个问题，代码如下：&ltscript type="textjavascript"&gtvar a = 1
在CSS样式表中display是什么意思？
display 属性规定元素应该生成的框的类型,用的最多的就是display:block显示 display:none隐藏。下面是所有值的用法描述。display本身意思是“显示、阵列”的意思x0dx0a值描述x0dx0ax0d
js全选，反选，取消
&lt!DOCTYPE HTML PUBLIC "-W3CDTD HTML 4.0 TransitionalEN"&gt&lthtml&gt &lthead&g
关于JS的问题（设计二维数组）
&ltscript type="textjavascript"&gt你的代码var myarr = [['小A','女',21,'大一']
CSS 最简洁hover事件的淡入淡出写法,且不占文档流位置!
关于CSS的特效,大部分都是使用了hover事件,或者你再完成一些特殊要求的时候,你会使用mouseenter和mouseleave来代替hover,我就遇到过一种就是鼠标移开时,悬浮显示的元素依然占了文档流,而且你不能使用display:
js 如何判断文字显示不全(text-overflow: ellipsis;)
如果在css中加入多余的文本会被... 所代替但是js中并没有判断这个文本是否有多余的文本下面可以使用 isEllipsis 函数来判断使用方法,传入一个dom,返回true或false 如果为ture则有多余文
怎么更改电脑中的快捷键
更改电脑快捷键操作如下： 1、打开电脑，在电脑桌面单击右键并选择新建。2、在弹出的菜单中选择快捷方式。 3、点击创建快捷方式对话框中的浏览。 4、单击计算机选项，从中选择程序建立快捷方式。 5、回到桌面，右键点击该程
PS里执行滤镜在哪里？
PS里执行滤镜在PS菜单栏上面的滤镜里面。点击就可以进入选择。PS滤镜主要是用来实现图像的各种特殊效果。它在PS中具有非常神奇的作用。滤镜通常需要同通道、图层等联合使用，才能取得最佳艺术效果。如果想在最适当的时候应用滤镜到最适当是位置，除了
html中如何改变字,比如改成楷书或行书
标签不重要，加入一个style就好了：用法：style="font-family:楷体"示例：&ltbody style="font-family:楷体"&gt...&ltb
ecshop站外投放js怎么做
ecshop的dwt模板页面引入js的方法 {* 包含脚本文件 *} {insert_scripts files='common.js'} 或者 test.js应放在你模板时的js文件夹下 js效果就写在你引入的js文件
这种QQ透明气泡是怎么弄的呀？
1、首先下载qq透明气泡生成器安卓版，安装到手机上，如下图所示。2、然后点击主界面中的透明气泡，出现如下图所示的设置界面。3、点击蓝字【开启我的透明气泡之旅】就可以生成了，非常方便好用。QQ：是腾讯QQ的简称，是腾讯公司开发的一款基于I
电脑突然没反应关不了机什么原因
电脑没有反应也关不了机，原因如下：1、检查最近安装的软件、补丁、插件、驱动全部卸载试试，如果是驱动不合适。2、电脑有木马，下载杀毒软件全盘杀毒。3、不经常出现蓝屏关机在开机就可以了，开机按F8不动到高级选项出现在松手，选“最近一次的正确配置
js移除css样式文件
需求不是很明确，要是移除link进来的css文件的话。那就是先找到所有link标签，然后依次移除，代码如下：var links = document.querySelectorAll('link')for(var i
电脑怎么用手机流量上网
电脑可以使用手机的热点进行上网，具体的操作步骤如下。工具／原料：联想AIO510S、Windows10、iPhone13、iOS15.3、联想网络设置、苹果设置软件。步骤：1、打开设置，点击无线和网络进入。2、进入后，点击移动网络共享
电脑上怎么录音唱歌?
电脑唱歌录音软件怎么在电脑上自己录歌在开始菜单最下方有个搜索框，输入录音，就会弹出录音机窗口，把录音机拖到桌面上，每次想录音直接打开就可以了，录完保存就可以了。怎样使用电脑唱歌 15分电脑K歌、录歌必备设备和条件：1、网
求js控制在网页中禁用右键和禁止另存为的代码。
不用js也可以控制禁止右键!方法:&ltbody oncontextmenu="return false"&gt&ltbody&gt下边是三个不同的禁用右键的方法!有详细的使用说明!ht
css 梯形，三角形实现原理
首先，我们画一个div，给div加上border，看看盒子模型本来的样子梯形：由此可见，css绘制的梯形并不是一个容器，只是容器的一条边。css把容器的其余三条边设置为透明的，只显示需要的一条边，就是一个梯形了。直角梯形
有源音箱怎么与电脑连接?
一、与电脑连接后没有声音，按照下面步骤进行检查x0dx0a1.检查音箱连接线，确保连接正常。x0dx0a 2.右击我的电脑－属性－硬件－设备管理器，看设备前面有没有黄色的“？”或“！”。如果有，重新安装这个设备的驱动程序。 x
at.js 如何解决IE7
这肯定是属于浏览器的兼容性问题。IE7和IE8属于非标准浏览器，与标准浏览器（火狐、谷歌以及IE9以上）之间存在很严重的兼容性问题，一般都需要专门针对非标准浏览器单独写一份js代码和css样式表，然后通过代码先判断浏览器的版本再调用相应的代
html+css怎么做网页?
创建一个文本文档，输入以下内容：&lt!DOCTYPE html&gt&lthtml&gt&lthead&gt&ltstyle&gtp {background-color:

推荐阅读

热门文章

最新发布

标签列表

如何用python爬取js动态生成内容的页面

给您推荐相同类型的内容：