如何用python爬取js动态生成内容的页面

2023-02-25 19:15:01Python015

如何用python爬取js动态生成内容的页面,第1张

抓取js动态生成的内容的页面有两种基本的解决方案

1用dryscrape库动态抓取页面

js脚本是通过浏览器来执行并返回信息的，所以，抓取js执行后的页面，一个最直接的方式就是用python模拟浏览器的行为。WebKit 是一个开源的浏览器引擎，python提供了许多库可以调用这个引擎，dryscrape便是其中之一，它调用webkit引擎来处理包含js等的网页！

2 selenium web测试框架

selenium是一个web测试框架，它允许调用本地的浏览器引擎发送网页请求，所以，它同样可以实现抓取页面的要求。

一、查看相应的js代码，用python获取原始数据之后，模仿js编写相应的python代码。

二、通过接口api获得数据，直接使用python获取接口数据并处理。

三。终极方法。使用 Selenium和PhantomJS执行网页js代码，然后再获取数据，这种方法100%可以获取数据，确定就是速度太慢。

对于这种动态加载的网站，建议使用第三方库selenium爬取。

它可以完全模拟浏览器，等待网站全部加载完成后再进行数据的自动获取。

对于主流的ChromeDriver、InternetExplorerDriver、FirefoxDriver、OperaDriver都支持，网站上的元素也支持多种选择器，如class、id、xpath等。

但是用习惯以后，对于这种非纯静态页面，离开selenium感觉就完全不会爬虫了。

页面浏览器数据是一个引擎

# 上一篇：C语言中什么是实型数？

# 下一篇：ruby rose 是什么动漫

给您推荐相同类型的内容：

c语言中什么是单精度型和双精度型？？？各举个例子。。。
单精度型和双精度型的区别在于它们的精确程度不一样，也就是小数部分的有效位数不一样。单精度数（float型）在32位计算机中存储占用4字节，也就是32位，有效位数为7位，小数点后6位；双精度数（double型）在32位计算机中存储占用8字节
太厉害了:居然有人将各大编程语言绘成了一部编年史
大数据文摘出品编译：狗小白、云舟代码是一门语言，这门语言搭建了人与计算机沟通的桥梁。通过编写代码，人类可以“命令”计算机开发网页、开发软件、搭建游戏 ... ... 这门语言并不是上帝的发明，它是前辈们发挥
python response 中文乱码问题
获得response.text有如下类似的乱码：解决方法有两种：第一种： apparent_encoding方法是requests库利用chardet对字节流编码进行了猜测。一般来说使用这种方法，大部分网页的中文乱码都会恢复
python3 crc8校验-3步实现计算
最近项目中用到了跟硬件通信的crc8校验，花了点时间研究了一下python的crc8校验，但是一直没有找到好的技术突破。 google了一番，昨天测试了网上的几种方法都不正确，确定了使用crcmod库来实现，参考官方文档和国内的一遍文章
Camille的《Ruby》歌词
歌曲名:Ruby歌手:Camille专辑:Le Sac Des FillesRuby, What am I gonna do with youBabe you choose what you wanna doDon't want
有没有动漫女主角是四个女生的其中一个拿着镰刀
《RWBY》（发音同Ruby）是一部在2013年7月首播的原创网络动画。R、W、B、Y 分别是英语红白黑黄的首字母，代表的分别是四位女主角的主题色。该作由美国Rooster Teeth Productions（公鸡牙齿）动画工作室RWBY团
为什么要使用 Go 语言，Go 语言的优势在哪里
您好，我来为您解答：优势：1. 有Google这个大厂在背后撑腰，语言设计质量值得期待；2. 有活跃社区支持，组件产品的开发和使用值得发掘，服务质量值得期待；3. 各种相关基础设施完备好用；4. 语言学习难度低，上手快，人力资源培养速度和
C语言中怎么字符串赋值？
需要准备的材料分别有：电脑、C语言编译器。1、首先，打开C语言编译器，新建一个初始.cpp文件，例如：test.cpp。2、在test.cpp文件中，输入C语言代码：char a[20]strcpy(a, "hello"
Go语言HTTPServer开发的六种实现
学完了 nethttp 和 fasthttp 两个HTTP协议接口的客户端实现，接下来就要开始Server的开发，不学不知道一学吓一跳，居然这两个库还支持Server的开发，太方便了。相比于Java的HTTPServer开发基本上都
python代码如何转换成C语言代码？代码如下：
转换c语言后的代码：void tset(int s[],int n){ for(int i=0i&ltni++)s[i]=s[i]+1}int s[]={1, 2, 3, 4, 5, 5, 6, 1, 4, 5, 5, 7, 1
Python中的锁都具有哪些？
大致罗列一下：一、全局解释器锁（GIL）1、什么是全局解释器锁每个CPU在同一时间只能执行一个线程，那么其他的线程就必须等待该线程的全局解释器，使用权消失后才能使用全局解释器，即使多个线程直接不会相互影响在同一个进程下也只有一个线程使用cp
c语言输出函数中为什么a[2]表示一个元素
如果 a 是一维数组，则语句和表达式中的 a[2] 表示数组的一个元素。数组的下标从0起算，a[2] 则是第三个元素。a[2] 也可以表示成指针指向的值的形式 *(a+2)。例如：int a[]={1,2,3,4,5}printf(&
C语言怎样输入字母？
#include&ltstdio.h&gtvoid main(){char str[3]printf("请输入you：")scanf("%s",str)if(str[0]=='
python读取文件内最多多少行字符
1048576行。python读取文件内最多1048576行字符。Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990年代初设计，作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构，还能简单有效地面向对象编
python解析xml降低内存
1. 使用ElementTree模块，它是Python标准库中提供的一个XML解析模块，它使用简单，非常容易使用，可以降低内存占用。2. 使用lxml模块，它是一个高性能的XML和HTML解析器，可以有效的降低内存占用。3. 使用iterp
ruby rose 是什么动漫
RWBY吗？一部美番，目前正在热更第二季，是部不错的美番，作者在第一季完结的时候逝世了，她的女儿们在母亲离开后依然健康的成长，目前第二季动作剧情还是可以的，虽然经常被“完美主义”喷...1个。RubyRose，1986年3月20日出生于澳
新概念C语言131中NEXT结构
首先 a[0].next = &ampa[1]a[1].next = &ampa[2]而p = &ampa[0]这样打印的时候带入就可以了先打印p-&gtn 等同于 a[0].n = 5然后是p-&am
小团团为什么叫rubyonly
是粉丝给她起的rubyonly名字。小团团斗鱼人气主播，直播游戏：绝地求生、英雄联盟。小团团的一条视频在抖音上大火特火，就连很多官方号都引用这个视频的音频素材。最初，小团团在斗鱼上只是小主播，很难拿到推广资源。而小团团把制作的短视频上传
Go语言的支持平台
LiteIDE是一款专门为Go语言开发的跨平台轻量级集成开发环境（IDE），由QT编写。LiteIDE主要特点：支持主流操作系统WindowsLinuxMacOS XGo编译环境管理和切换管理和切换多个Go编译环境支持Go语言交叉
10道经典的C语言例题(含参考程序)
1.打印出所有的“水仙花数”，所谓“水仙花数”是指一个三位数，其各位数字立方和等于该数本身。例如，153是一个“水仙花数”，因为153=1^3+5^3+3^3。#include #include int
C语言中的"a%2"是什么意思??
a%2 实现的功能就是判断a是奇数还是偶数。C语言中a%b表示变量a对b取余，即如果a除以b的余数为0，那么a%b的结果就为1（1表示真），如果a除以b的余数不为1，那么a%b的结果就为0（0表示假）。运算符% 是C语言中一种比较常
如何用python爬取js动态生成内容的页面
抓取js动态生成的内容的页面有两种基本的解决方案1用dryscrape库动态抓取页面js脚本是通过浏览器来执行并返回信息的，所以，抓取js执行后的页面，一个最直接的方式就是用python模拟浏览器的行为。WebKit 是一个开源的浏览器引擎
GO短信是什么
GO短信加强版是在原GO短信版本上进行全面升级的高级版本，是一款完全免费、界面酷炫、支持气泡式列表会话界面、支持来信即显弹窗、拥有信息备份恢复功能、支持安全锁加密黑名单，支持文件夹管理、拥有丰富个性化设置的android短信应用。
有关C语言指向指针的指针
我就用自己的理解给你讲一下吧指针其实就是指向一个变量的变量,具体的说,一个指针它里面保存的是一个变量的地址,而一般的变量保存的是数据,所以指针它的本质也是变量.指向指针的指针就是一个指针它指向另外一个指针变量,它保存的是另外一个指针的地址,
ruby是什么意思 ruby的意思
1、ruby的意思：n.红宝石深红色adj.红宝石的红宝石色的2、ruby的读音：英[ˈruːbi]美[ˈruːbi]3、[例句]The crown was set with precious jewels ─ diamonds,
用C语言编写一个单片机控制LED灯闪烁变化的编程急用！！！！！！！！！
C语言实现LED灯闪烁控制配套51单片机开发板。#include 包含单片机寄存器的头文件****************************************函数功能：延时一段时间***************
go语言实现utf8和ucs2编码转换
二进制包安装的话：如果安装在了默认位置例如usrlocalgo (Windows系统：c:Go)这个时候可以不需要设置GOROOT，如果改变了安装的这个默认目录，那么就需要设置GOROOT GOROOT的概念有点Go安装目录的意思
魔兽世界法师宏请教！
冰箱能用就冰箱，没冷却就急速冷却+冰箱：把寒冰屏障放到一个你不用的按钮上，记下编号，编号看上边基础知识，把红色字用你查到的编号代替script local c,i,b,f,d,_=CastSpellByNamefor i=1,16 do
级数是在那门课程里
一高等数学指的是哪几门课程高数是一个统一的称呼，范围也是根据专业而不同的。以研究生考试的标准来说，理工科的回学生考的是高数一答，二；经济类，管理类的学生考的是高数三，四。具体的来说，高数一（二）包括的内容有：一元和
python中去除数组中inf
在python中，可以使用numpy模块的finite()函数来去除数组中的inf值，该函数可以判断每个元素的值是否为无穷大，如果是，则返回false，否则返回true。例如：import numpy as np arr = np.arra

推荐阅读

热门文章

最新发布

标签列表

如何用python爬取js动态生成内容的页面

给您推荐相同类型的内容：