4种Python爬虫（3. 微信小程序，如，超级猩猩）

2023-02-25 14:16:02Python019

4种Python爬虫（3. 微信小程序，如，超级猩猩）,第1张

1. PC网页爬虫

2. H5网页爬虫

3. 微信小程序爬虫

4. 手机APP爬虫

爬取超级猩猩的课表，该平台仅提供了微信小程序这一个途径，前面两种针对html网页的爬取方式都不再适用。

采用抓包分析是我们制定方案的第一步。

我用的Mac电脑，fiddler只有一个简化版，所以另找了Charles这个类似的软件。启动Charles的代理，在手机WIFI中设置好对应的代理就可以开抓了。但是，抓到的https包的内容都是乱码，咋办？

Charles中提供了ssl证书，在手机端安装证书即可。推荐使用iPhone，直接安装描述文件即可。Android手机必须使用系统版本在7.0以下的才行，7.0以上还需要反编译什么的，太麻烦了。

很容易的定位到了超级猩猩微信小程序载入课表的后台接口。拿这个URL在浏览器里访问试试，直接返回了json结果！超级猩猩很友好！

提取对应的URL，放到浏览器中验证，也可以支持返回json包，剩下就是分析一下这个json的数据结构，按照需要的方式导出了。

直接通过接口的爬取效率非常高，几秒钟就拉取了全国各个门店的排课，相当舒心。（下图的录屏没有进行加速）

最后一个挑战就是对只有Android/iOS的APP端应用数据的爬取。请看下一章

请点击： <下一页>

过程很繁琐，步骤如下：

1、写按键精灵脚本，在手机上自动点击公号文章列表页，也就是“查看历史消息”；

2、使用fiddler代理劫持手机端的访问，将网址转发到本地用php写的网页；

3、在php网页上将接收到的网址备份到数据库；

4、用python从数据库取出网址，然后进行正常的爬取。

如果只是想爬取文章内容，似乎并没有访问频率限制，但如果想抓取阅读数、点赞数，超过一定频率后，返回就会变为空值，我设定的时间间隔为10秒，可以正常抓取，这种频率下，一个小时只能抓取360条，已经没什么实际意义了。

微信公众号数据储存

1、腾讯不对你在本服务中相关数据的删除或储存失败负责。

2、腾讯有权根据实际情况自行决定单个用户在本服务中数据的最长储存期限，并在服务器上为其分配数据最大存储空间等。你可根据自己的需要自行备份本服务中的相关数据。

3、如果你停止使用本服务或服务被终止或取消，腾讯可以从服务器上永久地删除你的数据。服务停止、终止或取消后，腾讯没有义务向你返还任何数据。

爬虫腾讯数据猩猩网页

# 上一篇：ffmpeg-python中文文档（三）——API参考

# 下一篇：R语言plot函数如何改变边框粗细

给您推荐相同类型的内容：

c语言必背代码32个单词
数据类型关键字(8个)int 、short 、long、signed、unsigned、char 、float,、double程序控制关键字(10个)if 、else、switch、case、default、break、do 、
如何在python中创建二维列表
Python中创建二维列表数组，即创建一个list，并且这个list的元素还是list。可以用列表解析的方法实现。创建例子如下：2d_list = [[0 for col in range(cols)] for row in rang
go语言到底有什么好处
1. 部署简单Go 编译生成的是一个静态可执行文件，除了glibc外没有其他外部依赖。这让部署变得异常方便：目标机器上只需要一个基础的系统和必要的管理、监控工具，完全不需要操心应用所需的各种包、库的依赖关系，大大减轻了维护的负担。2. 并发
python里函数的定义
定义：def 函数名(形参1,形参2='初始定义的内容'):函数中执行的内容调用：函数名(实参1)或函数名(形参2=实参2,形参1=实参1)或函数名(实参1,实参2)params 就是(5, 5)(5,) * 2 ,就是
「测试开发全栈化-Go」(1) Go语言基本了解
作为一个测试，作为一个测试开发，全栈化+管理是我们未来的发展方向。已经掌握了Java、Python、HTML的你，是不是也想了解下最近异常火爆的Go语言呢？来吧，让我们一起了解下。Go 是一个开源的编程语言
Java中的集合有哪些在什么情况下使用
Collection：List、SetMap：HashMap、HashTable如何在它们之间选择一、Array ， ArraysJava所有“存储及随机访问一连串对象”的做法，array是最有效率的一种。1、效率高，但容量固定且无法动态改
R语言向量计算的数学函数汇总2021.1.21
sum(向量名）：求和max(向量名）：返回向量最大值min(向量名）：返回向量最小值range(向量名）：返回向量中的上界和下界mean(向量名）：返回向量平均值var(向量名）：返回向
好怀念Java的口袋精灵之英雄大陆啊，怎么就不出个安卓的，现在的宠物游戏，全是q版。一点意思都没有
修仙炼妖传3-回梦寻仙内购破解版3.3m泰若怪兽2直装版修改版(无限金币钻石)v9.15与神奇宝贝相似的RPG游戏163.8m超进化精灵破解版(第一个商店买一件负数商品即可获无限金币)v1.2.14类似口袋妖怪的回合制角色扮演游戏36.
Python3 生成一个随即列表
Python 生成一个随即列表 -1.最原始的方法--循环 import random#随机数的库 l = []# 先定义一个空列表 for i in range(1,100): x
r语言偏度峰度函数需要安装什么包
moments包。R语言使用moments包计算偏度（Skewness）和峰度（Kurtosis）实战计算偏度（Skewness）和峰度（Kurtosis）、确定样本数据是否具有与正态分布匹配的偏度和峰度（假设检验）。R语言-统计学描述性
go语言中实现切片(slice)的三种方式
定义一个切片，然后让切片去引用一个已经创建好的数组。基本语法如下：索引1：切片引用的起始元素位索引2：切片只引用该元素位之前的元素例程如下：在该方法中，我们未指定容量cap，这里的值为5是系统定义的。在方法一
go语言适合做什么
go语言适用的领域有：Go语言主要用作服务器端开发，其定位是用来开发“大型软件”的，适合于很多程序员一起开发大型软件，并且开发周期长，支持云计算的网络服务。Go语言作为服务器编程语言，很适合处理日志、数据打包、虚拟机处理、文件系统、分布
go语言的webengine叫什么
Java教程Linux入门更多&gt&gt 首页Go语言WEB框架(Gin)详解在 Go语言开发的 Web 框架中，有两款著名 Web 框架分别是 Martini 和 Gin，两款 Web 框架相比较的话，Gin 自己说它比
如何从python2.6.1升级到2.6.7
1、安装包名称：python-2.7.9.msi，百度相应的工具下载。2、双击以上安装包安装时要注意一个选项，如图所示：这个选项是将python添加到默认路径当中的，这样在cmd状态下就可以直接调用python命令了，建议勾选上。3、之后一
python爬取网页内容数据需要建文件夹吗
需要。python爬取网页内容数据之就需要建一个文件夹来存放爬取的内容。Python由荷兰数学和计算机科学研究学会的吉多范罗苏姆于1990年代初设计，作为一门叫做ABC语言的替代品。当用python爬取大量网页获取想要的数据时，最重要的问
好听点的英文名字
女生好听的英文名大全Abby: 娇小可爱的女人，文静，令人喜爱，个性甜美。 Aimee: 意为可爱的人。 Alisa: 快乐的姑娘的意思。 Angelia: 天使，传送讯息者。Angelia被描绘为美丽，娇小的女子若不是有著
C语言如何表达非。
C语言 "非"运算用惊叹号表示。它是1目运算符，（即只需一个操作数的运算）。例如：int a=0, bb= !a 这是把非a 的结果赋值给 bprintf("%d", b)---I
go语言培训班哪个好
很多人盲目的寻找所谓的go语言开发培训排行榜，但是因为没有一个统一的标准，这样一个靠谱的排行榜其实不存在，请注意我这里说的是靠谱的。排行榜有，但都是一些个人总结的，有太多的个人主观的喜好在里面，没有权威的第三方机构进行评测。那么排行榜不靠谱
go语言 ioutil.ReadFile 与ioutil.ReadAll差别
当读取91.2 MB文件时，read1耗时43ms，read2耗时99ms。查看源码：读取文件主要是通过 Read(p []byte) (n int, err error) ：官方文档中关于该接口方法的说明：
C语言参考手册的内容简介
本书是关于C语言的详尽的参考手册。最新的第5版增加了对C99标准的介绍，更加符合当前读者学习C语言的需要。全书分为两大部分，共24章。第一部分讨论了C语言的所有语言特征，包括词法、预处理机制、声明、类型、表达式、语句以及函数等基本语言特性。
R语言变量赋值和提取获取环境中的变量并赋值 assign和get函数使用
在进行循环的时候，经常需要把环境中的变量通过字符的形式提取出来并赋值给新的变量，涉及到环境变量和字符的转换问题。在R语言中，，可以通过 assign() 和 get() 这两个函数操作。get ：返回和字符串同名的变量的值
暗黑v1.09合成全部配方
暗黑2合成公式（转的）由于很多朋友对E文版的公式难以理解，经木头提醒，转贴至此，希望能对大家有所帮助110合成公式克莱姆的连枷+克莱姆之心+克莱姆之眼+克莱姆之脑-&gt超级克莱姆连枷1个怀特的脚＋1个回城书-&gt通往奶牛
C语言中的与或非运算
C语言中的与、或、非是C语言的逻辑运算符。1、逻辑与在C语言中逻辑与用&amp&amp表示。举例：a&amp&ampb（其中a、b都代表一个条件）如果a和b都为真，则结果为真，如果a和b中有一个条件为
郑州java软件开发培训学校哪家好
郑州比较好的java培训有千锋教育、动力节点、蜗牛学院、达内、传智播客、IT培训网、中软国际教育集团、课工场、开课吧等等，这些都是知名的品牌。千锋教育就有线上免费Java线上公开课。随着IT行业特别是Java行业的迅速发展，企业对于技术人
Go语言编程入门时需要注意什么
刚入门Go语言小白需要注意以下五点：1、注意书写代码的一些规范吧，特别是注意大小写、英文标点符号区别等，在特别的位置写上注释。2、主要是理解伪代码所描述的算法，伪代码要注意是不能直接运行的。3、注意编译器版本与书籍上所介绍版本是否一致，也注
《义犬救主 (2022)》免费在线观看完整版高清，求百度网盘资源
《义犬救主 (2022)》百度网盘高清免费资源在线观看链接: https:pan.baidu.coms14NyddmU-5Sc6NTzl7knl_A?pwd=ev7b 提取码: ev7b 导演: 凯特·西亚编剧: 凯伦·詹森
关于R语言的数据类型和数据结构的如何区分
注意区分：数据类型和数据组成类型（数据结构）数据类型：整型、浮点型、字符型、布尔型（不同的语言不同的叫法）数据结构：向量(c())、矩阵(matrix())、数组(array())、列表(list()) 注
计算机二级C语言选择题及答案(2)
} printf("%dn"，num) } 程序执行后的输m结果是()。 A.35 B.37 C.39 D.3975 32.以下程序的'输出结果是()。 main()
C语言接口是什么意思？
是指同一计算机不同功能层之间的通信规则称为接口。java接口作用：1、利于代码的规范。这样做的目的一方面是为了给开发人员一个清晰的指示，告诉他们哪些业务需要实现；同时也能防止由于开发人员随意命名而导致的命名不清晰和代码混乱，影响开发效率。2
烟台科技学院地址
烟台科技学院地址：山东省烟台市蓬莱区仙境西路34号烟台科技学院是一所以工学、管理学、艺术学为主，多学科协调发展的全日制普通本科高校，具有颁发国家承认的统招本、专科学历资格，并具有学士学位授予权。学校前身是创建于2005年的济南大学泉城学院，

推荐阅读

热门文章

最新发布

标签列表

4种Python爬虫（3. 微信小程序，如，超级猩猩）

给您推荐相同类型的内容：