如何用python爬取js动态生成内容的页面

2023-02-26 06:23:02Python015

如何用python爬取js动态生成内容的页面,第1张

抓取js动态生成的内容的页面有两种基本的解决方案

1用dryscrape库动态抓取页面

js脚本是通过浏览器来执行并返回信息的，所以，抓取js执行后的页面，一个最直接的方式就是用python模拟浏览器的行为。WebKit 是一个开源的浏览器引擎，python提供了许多库可以调用这个引擎，dryscrape便是其中之一，它调用webkit引擎来处理包含js等的网页！

2 selenium web测试框架

selenium是一个web测试框架，它允许调用本地的浏览器引擎发送网页请求，所以，它同样可以实现抓取页面的要求。

对于这种动态加载的网站，建议使用第三方库selenium爬取。

它可以完全模拟浏览器，等待网站全部加载完成后再进行数据的自动获取。

对于主流的ChromeDriver、InternetExplorerDriver、FirefoxDriver、OperaDriver都支持，网站上的元素也支持多种选择器，如class、id、xpath等。

但是用习惯以后，对于这种非纯静态页面，离开selenium感觉就完全不会爬虫了。

页面浏览器是一个引擎动态

# 上一篇：C语言中从键盘上输入三个数，将之排序后按由大到小的顺序输出

# 下一篇：Python常用的标准库以及第三方库有哪些？

给您推荐相同类型的内容：

请教Python中匹配IP的正则表达式
下面是IPv4的IP正则匹配表达式import re#简单的匹配给定的字符串是否是ip地址,下面的例子它不是IPv4的地址，但是它满足正则表达式if re.match(r"^(?:[0-9]{1,3}.){3}[0-9]{1,
MAC的 RUBY WOO口红怎么辨别真假，有哪些方法？
1.口红纸盒部分假货与正品相似度超95%。实际拿在手上要找出不同点还是得往细节看，盒子红色部分有一定色差，真的包装盒是磨砂质地的，色彩更为艳丽明亮，哑光的处理，手感顺滑；假的盒子整体较为光滑，容易留指纹，红色部分在暗沉一些。文字细节上一一比
c语言中rand()函数怎么用?
rand函数功能为获取一个伪随机数（伪随机数的概念下面会有介绍）。一、函数名：rand()二、声明：int rand()三、所在头文件：stdlib.h四、功能：返回一个伪随机数。之所以说是伪随机数，是因为在没有其它操作下，每次执
go语言的reflect（反射）
1、反射可以在运行时动态获取变量的各种信息，比如变量的类型、类别； 2、如果是结构体变量，还可以获取到结构体本身的信息（包括结构体的字段、方法）； 3、通过反射，可以修改变量的值，可以调用关联的方法； 4、使用反射，需要
Python能用来做什么？
Python因语法简洁、上手简单、功能强大特点，广泛应用于网站开发、数据分析、爬虫、自动化运维、人工智能、大数据、游戏开发等领取。1、做日常任务，比如下载视频、MP3、自动化操作excel、自动发邮件。2、做网站开发、web应用开发，很多著
Go语言的应用
Go语言由Google公司开发，并于2009年开源，相比JavaPythonC等语言，Go尤其擅长并发编程，性能堪比C语言，开发效率肩比Python，被誉为“21世纪的C语言”。Go语言在云计算、大数据、微服务、高并发领域应用应用非常广
C语言数组读入
#include&ltstdio.h&gt#include&ltstring.h&gt用字符串来解决问题void main(){int m[10]={0} *数组*int i=0,j=0
如何了解 ruby 的类和对象
Ruby是一个完美的面向对象编程语言。拥有面向对象的编程语言的功能，包括：1、数据封装2、数据抽象3、多态性4、继承这些功能已在讨论面向对象Ruby面向对象的程序涉及类和对象。一个类是蓝本，从个别对象被创建。在面向对象的术语，我们说小明的
python怎么输入一个列表输出后事是列表0
Python中如何input⼀个列表并且print打印输出该列表Python要从键盘连续输⼊⼀个数组，并⽤空格隔开，Python中的实现⽅法如下：str = input(‘以空格为间隔连续输⼊⼀个数组:’)然后在键盘中输⼊，会得到的str为
Ruby语言做大型数学运算怎么样？
这种脚本语言做大型计算，计算能力肯定是不太够的，一般都依赖于其它语言编写的高性能计算的库，比如python就有numpyscipypandasmatplotlib等一系列库，这使得python比较适合进行大型科学计算，ruby也有相当
linux 怎么编译c的源程序的？gcc，编译命令是什么？
在Linux下面,如果要编译一个C语言源程序,我们要使用gcc编译器。先将源文件编译成目标文件：gcc - c hello.c生成hello.o文件，再将目标文件编译成可执行文件：gcc -o hello hello.o如：int
「测试开发全栈化-Go」(1) Go语言基本了解
作为一个测试，作为一个测试开发，全栈化+管理是我们未来的发展方向。已经掌握了Java、Python、HTML的你，是不是也想了解下最近异常火爆的Go语言呢？来吧，让我们一起了解下。Go 是一个开源的编程语言
Python-类的创建和使用
创建一个宠物 Pet 类，根据该类创建的每个实例都将存储名字和物种，赋予每个宠物吃饭（eat()）和睡觉（sleep()）的能力：根据类创建实例调用方法给上面的例子进行补充，设置一个宠物到家的初始时间默认值为 0，对某个属
ruby 网页抓取脚本，怎么写
ruby操作excel文件使用ruby来操作excel文件首先需要在脚本里包含以下语句require'win32ole'把win32ole包含进来后,就可以通过和windows下的excelapi进行交互来对excel文
Golang 的静态编译
Go 语言和 C 语言的一个很大的区别是， Go 语言只静态编译，做个测试：一方面是 Go 语言编译后的可执行文件大小比 C 语言的大很多，另一方面是 C 语言的可执行文件需要依赖 glibc 动态库，用 ldd 命令可以
GO 一文搞懂指针和地址值的区别
go语言中的指针和地址值，在使用上常常具有迷惑性，主要是其特殊的*、&amp符号的使用，可能会让你摸不透，本文希望能讲清楚go语言的指针(pointer)和值(value)。这里先简单的对指针和地址值概念做一个定义：这
如何查看Python3安装及第三方库路径
有时候，我们想要查找Python安装路径及第三方库的存放路径，但可能忘记了当初安装时的具体路径，这个时候我们就可以通过命令快速找到这些路径。在 Linux &ampMac 下，我们查到的很可能是软链接形式，它并不是安装的实际路
用Python实现三阶矩阵的求逆？
你好，下面是一个对应的三阶矩阵求逆的代码import warningswarnings.filterwarnings("ignore")matrix1 = [ [1,2,0,0], [3,4,0,0],
golang做后台开发有什么优势和劣势
golang在近些年被追捧，不管某华，某阿在很多服务器开发上都在使用。你不用怀疑golang的优势：部署简单，良好的语言设计，并发性好，性能优良，开发简洁快，标准库强大，编译简单缺点：还存在一些缺陷（例如垃圾回收），缺少安全检查，性能方面目
Go语言变量的作用域
2021-10-22 每一个变量（常量、类型或函数）在程序中都有一定的作用范围。称之为作用域。 Go语言在编译时会检查每一个变量是否使用过，未使用过的变量就会编译错误。根据变量定义位置的不同，可以分为以下三个类型：在函数
python和ruby脚本区别大吗？他们与php互相调用方便吗？另外在怎么在php里面获取shell输入的内容？
三个PHP调用系统命令函数的区别与联系我们在执行linux系统的shell命令时，会用到PHP调用系统命令函数来实现。那么在这些函数中，主要包括了system()，exec()，passthru()这三个经常用于外部命令调用的函数。虽然这三
C语言字符数占几个字节,又是多少位。
这个要看字符数是什么数据类型，可以用sizeof(类型)操作符来测试字节数。1、英文字母：如果是char 型，那么是占用1个字节，8位。如果是string型，应该是两个字节，16位，因为末尾还有个字符。比如：char c = '
go语言怎么输出存放指针的数组
以下代码在VC6.0以上版本测试通过！输出结果：6#include &ltstdio.h&gtint main(void){int a[2][2] = {{1,2}, {3,4}}int b[2][2] = {{5,6},
谁用过python中的第三方库face recognition
简介该库可以通过python或者命令行即可实现人脸识别的功能。使用dlib深度学习人脸识别技术构建，在户外脸部检测数据库基准（Labeled Faces in the Wild）上的准确率为99.38%。在github上有相关的链接和AP
Python常用的标准库以及第三方库有哪些？
推荐5个常用的Python标准库：1、os：提供了不少与操作系统相关联的函数库os包是Python与操作系统的接口。我们可以用os包来实现操作系统的许多功能，比如管理系统进程，改变当前路径，改变文件权限等。但要注意，os包是建立在操作系
c语言如何读写 linux文本文件？
Linux下C语言的文件（fputc,fgetc,fwrite,fread对文件读写操作）fputc 向文件写入字符#include &ltstdio.h&gt#include &ltstdlib.h&a
面试问题总结（一）Golang
使用go语言的好处: go语言的设计是务实的, go在针对并发上进行了优化, 并且支持大规模高并发, 又由于单一的码格式, 相比于其他语言更具有可读性, 在垃圾回收上比java和Python更有效, 因为他是和程序同时执行的.1.
「测试开发全栈化-Go」(1) Go语言基本了解
作为一个测试，作为一个测试开发，全栈化+管理是我们未来的发展方向。已经掌握了Java、Python、HTML的你，是不是也想了解下最近异常火爆的Go语言呢？来吧，让我们一起了解下。Go 是一个开源的编程语言
如何用ruby调用另一个ruby脚本？
system（“.ruby”）或者load 'another.rb'具体代码如下：# 返回ls的输出s=`ls`cmd= "ls"s= `#{cmd}`# 返回true or false s= sys
linux 怎么编译c的源程序的？gcc，编译命令是什么？
在Linux下面,如果要编译一个C语言源程序,我们要使用gcc编译器。先将源文件编译成目标文件：gcc - c hello.c生成hello.o文件，再将目标文件编译成可执行文件：gcc -o hello hello.o如：int

推荐阅读

热门文章

最新发布

标签列表

如何用python爬取js动态生成内容的页面

给您推荐相同类型的内容：