如何用python爬虫直接获取被js修饰过的网页Elements？

2023-03-02 01:05:02JavaScript025

如何用python爬虫直接获取被js修饰过的网页Elements？,第1张

对于这种动态加载的网站，建议使用第三方库selenium爬取。

它可以完全模拟浏览器，等待网站全部加载完成后再进行数据的自动获取。

对于主流的ChromeDriver、InternetExplorerDriver、FirefoxDriver、OperaDriver都支持，网站上的元素也支持多种选择器，如class、id、xpath等。

但是用习惯以后，对于这种非纯静态页面，离开selenium感觉就完全不会爬虫了。

大家好，我是辣条。

一个建筑行业的堂哥为了搞一些商业数据前前后后花了1w，辣条我半个小时就能解决的事情，这就是技术的魅力【爬取是的公开数据！】

网址：监管平台

开发工具：pycharm 开发环境：python3.7， Windows10 使用工具包：requests，AES，json

进去h里面 (鼠标光标放到 h上面会显示他的 js地址如果没有显示就是证明你还没有执行到这里需要在前面打上断点刷新页面调试)

发现这个采用AES加密算法使用模型CBC模式采用填充方式为 Pkcs7

证明数据推导正确在 return r.toString() 打上断点

r里面数据正常返回

抓取js动态生成的内容的页面有两种基本的解决方案

1用dryscrape库动态抓取页面

js脚本是通过浏览器来执行并返回信息的，所以，抓取js执行后的页面，一个最直接的方式就是用python模拟浏览器的行为。WebKit 是一个开源的浏览器引擎，python提供了许多库可以调用这个引擎，dryscrape便是其中之一，它调用webkit引擎来处理包含js等的网页！

2 selenium web测试框架

selenium是一个web测试框架，它允许调用本地的浏览器引擎发送网页请求，所以，它同样可以实现抓取页面的要求。

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：组装电脑的电源瓦数应该如何选择？

# 下一篇：什么笔记本电脑玩游戏好性价比高

给您推荐相同类型的内容：

电脑密码破解的方法
日常操作中，我们经常要输入各种各样的密码，例如开机时要输入密码，QQ时也要先输入密码，假如你忘记了这些密码，就有可能用不了机器、打不开文件、不能聊天…… 也许还会造成很大的损失!下面我们就介绍电脑操作中常用密码的破解方法，希望能解你燃眉之急
《金田一少年事件簿》电脑山庄案
《金田一少年事件簿》电脑山庄杀人事件改编自天树征丸的金田一系列小说，本案结合时代大背景和谎言诡计成为了金田一中备受好评的案件之一，那么这个案件到底是怎样的呢，让我们一起来看看。《金田一少年事件簿》电脑山庄案
电脑可以用来干什么
1、搜索信息资料。连接到互联网的电脑，可以使用搜索引擎找需要的信息和资料。2、编辑文档和图像处理。利用电脑上常用的办公软件和图像处理软件，可以在电脑上编辑各种各样的文档和图片，如最为常用的Word、Excel、PPT文档、jpeg图片。
重装系统对电脑有什么影响
重装系统对电脑有以下影响：1、操作麻烦：在决定换系统后，要将电脑中的所有重要文件备份到移动存储设备中，如果要备份的文件太多的话就更加麻烦；还有在安装系统过程中有很多需要注意的地方，并且会出现各种异常情况。2、伤害硬盘：安装系统时会对系统的
微信在电脑上怎么隐藏起来怎么办
1. 微信怎么隐藏电脑版字样微信图标是可以隐藏的，在电脑端使用QQ2011 beta4及以上版本即可进行隐藏操作，操作方式如下： 1、电脑端登录QQ--gt；我的资料--gt；基本资料--gt；图标管理： 2、单击微信图标：
会计专业的买什么配置的电脑好
会计专业的买什么配置的电脑好以我的了解，会计用到的软体以Office系列居多，因此属于办公电脑。【参考配置】1、台式电脑（1）处理器：i3-6100；（2）主机板：B150M；（3）记忆体：4G DDR4 2133M
在电脑上怎么下载钉钉软件呢
电脑可以下载钉钉软件，钉钉作为一款社交软件及工作软件，被很多单位和个人所应用，电脑下载钉钉软件的具体方法如下：1、在浏览器上搜索“钉钉电脑版”；2、在打开的页面中选择“普通下载”；3、下载完成后双击安装程序；4、选择安装路径，安装完成后即可
海信电视如何连接电脑
问题一：海信电视怎么无线连电脑？ 50分海信电视和电脑多屏互动，一般需要电视机支持DLNA功能才能实现，一般方法如下： 1、首先电脑和电视机需要连接在同一路由器上，即构成局域网； 2、然后启动电视机，进入智能电视主界面，然后找到系
电脑假死是什么原因
电脑假死的现象是令人最厌烦的一种情况，当我们操作电脑的速度稍微快一点或者是多打开几个网页，运行了某个比较大的程序的时候，在这样的情况下电脑容易出现假死的现象，假死的现象表现为：电脑遇到运行某个程序时，计算机出现无法及时响应，导致操作系统假
电脑怎样彻底杀毒
问题一：电脑怎样杀毒最为彻底？楼主你好 1、电脑杀毒建议安装专业的杀毒软件，用杀毒软件在安全模式下全盘查杀处理病毒应当可以清理彻底，推荐试试腾讯电脑管家，它是免费专业安全软件，杀毒管理二合一(只需要下骇一份），占内存小，杀毒好，防护
什么笔记本电脑玩游戏好性价比高
1、联想Y700-ISE旗舰版说到适合玩游戏的笔记本电脑我们首先想到的就是这款联想Y700-ISE旗舰版，它是联想在2015年的时候上市的一款笔记本电脑。可以毫不夸张的说他就是为游戏而设计的。它的屏幕是15.6英寸，并不是很大，但是显示效
360兼容模式css动画无效
从修改前的图片很明显看出图片没有垂直居中与靠右对齐，而使用火狐浏览器与IE9都正常显示，唯独是360浏览器中显示不正常。我这个人比较追求完美，只要有一点瑕疵都会及时去掉。这些年来，养成一个习惯，有问题百度一下，搜索下“360浏览器不兼容CS
询问一下这个css网页代码怎么做，回答一部分采纳？
为了实现上下移门动画效果，你需要使用HTML、CSS和JavaScript来编写代码。具体来说，你可以使用HTML来构建网页的结构，使用CSS来设置网页的样式，并使用JavaScript来实现动画效果。具体的实现方法可以参考以下步骤：在H
免费wifi软件哪个好
360免费WiFi。集成于360安全卫士中的，想要找到只需在主界面的功能大全点击“更多”即可，新安装用户需要在未添加服务中找到“免费WiFi”图标，并点击完成初始化安装，或直接在搜索框中输入“WiFi”也能找到该工具。1. 下载什么软件可以
html表单年月日怎么弄
做年月日输入框的方法新建一个html文件2在文件中添加html代码架构在body标签里面使用inp标签添加输入框，并使用type属性实现年月日输入框4通过浏览器方式查看设计效给果。本地日期时间inputtypedate属性描述值这是HTM
电脑自动关机是什么原因
电脑自动关机是什么原因电脑自动关机原因及解决方法。出现电脑自动关机是什么原因的情况很多，下面我们来罗列下出现这种现象有几种可能情况：1.随着夏天气温的不断上升，如果电脑的CPU风扇如果不给力(主板散热性不好)，再加上目前大部分的主板上都有温
php 读取（解析）html文档，并将读取到的文档转为数组（数组保留html嵌套格式）
可以使用正则表达式来解决这个问题具体的代码很多不详细写了，举个例子给题主吧&lt?php $htmlStr = '&ltli&gt首页&ltli&gt'preg_match_
如何判断电脑配置好坏?
问题一：怎么看电脑配置的好与坏？那我就精简的说几句吧。CPU从处理数据能力的大小主要看CPU的频率，多核频率要高一些。这说明多核CPU的处珐能力要强很多。单核从某种意义来说是要差一点的。单是要看你做什么用途，如果要运行大程序，单核就不能
手机控制电脑的远程软件是什么？
以TeamViewer软件为例，操作如下：1、首先在手机和电脑都安装TeamViewer软件，电脑开启此软件。2、点击进去之后，在电脑软件上将计算机分配给该账号，这样就可以通过电脑密码直接连接，而不需要电脑那边确认同意。3、点击计算机，可
学云计算用什么电脑，尽量要有详细信息
你好1.云计算专业，在国内是比较新的计算机类专业。除了一些重点院校，国内许多大学还没有开这个专业2.云计算是近几年在国际上兴起的一门先进技术，它可以把所有的信息都汇集到互联网服务器里，然后通过手机、平板电脑等互联网移动设备获取信息。它最大的
电脑关机快捷键是？
电脑关机快捷键是Alt加F4加Enter键。计算机（computer）俗称电脑，是一种用于高速计算的电子计算机器，可以进行数值计算，又可以进行逻辑计算，还具有存储记忆功能。是能够按照程序运行，自动、高速处理海量数据的现代化智能电子设备。由
在R语言中,怎么调节坐标刻度数字与坐标轴的距离
许多R 的高级图形自身就含有坐标轴，此外你可以用低级图形函数axis() 设置你自己的坐标轴。坐标轴主要包括三个部分：轴线（axis line）(线条格式由图形参数lty控制)，刻度（tick mark）(划分轴线上的刻度) 和刻度标记（t
剪切的文件丢失如何恢复
剪切的文件丢失的恢复办法如下：如果文件剪切的文件丢失。正在编辑的word文档可以通过打开剪贴板找回，但是在电脑里面转移文件夹使用剪贴就容易导致文件丢失。Word文档有一个剪贴板功能，我们能够通过剪贴板找回丢失的文字内容并粘贴回文档中。Wi
宏基官网是什么
http:www.acer.com.cnaczhCNcontenthome宏碁集团（简称宏碁），品牌为“Acer”，是台湾的电脑制造公司，由施振荣等人于1976年8月1日创立，目前是全球第四大个人电脑制造商，同时也是全球第三
雷神911为什么被喷
性能差价格高雷神911zero被喷的原因是性能差价格高。雷神911zero是一款雷神品牌旗下的笔记本电脑,其主要采用中档次的i5处理器和次打显示屏,并对其售价定价为8000元,产品性能差,价格还高,所以被消费者所喷和吐槽。雷神也是用的蓝天模
一个js方法中怎么调用另一个js文件
Js文件中调用其它Js函数的方法：x0dx0a1、例如有这样一个html，里面有一个按钮，当按下时调用b.js文件中的方法b()。而b()中又要调用a.js文件中的方法a()。那我们应该怎么做呢？x0dx0a首先，在html中引入b
配置好的笔记本电脑
配置好的笔记本电脑推荐1、戴尔 n3010戴尔笔记本的配置一直都是比较好的，这款戴尔笔记本的'配置更加是没的说。这虽然是一款已经有点古老和经典的笔记本电脑，但是这款笔记本电脑的配置非常的好。采用的是i5处理器，屏幕的
笔记本电脑怎么调节屏幕亮度
笔记本电脑调节屏幕亮度方法如下（以windwows 7系统操作为例）：1、点击电脑桌面左下角的开始按钮，选择控制面板功能。2、在跳出的控制面板功能界面，点击外观和个性化按钮。3、在打开页面中，点击左下角的“显示”按钮。4、在打开页面的左侧
js 递归树
用jquery easyui~把它当json数据源给tree就可以显示。网址：http:www.jeasyui.comdemomainindex.php?plugin=Tree&amptheme=default&
如何清理电脑里中的垃圾文件
电脑用久了，会有很多垃圾文件，我们需要定时清理，如何清理电脑里中的垃圾文件?下面一起来看看吧! 步骤 1 1.打开"我的电脑"-"工具"-"文件夹选项"-"查看

推荐阅读

热门文章

最新发布

标签列表

如何用python爬虫直接获取被js修饰过的网页Elements？

给您推荐相同类型的内容：