python爬虫：微博评论分析

2023-02-24 19:46:02Python020

python爬虫：微博评论分析,第1张

最近王和李的离婚闹得沸沸扬扬，相信大伙们都已经吃了不少的瓜。本文结合李的第一篇文章发文下面的网友们的评论来看看大家到底怎么看待这件事。

数据来自该地址： https://weibo.com/5977512966/L6w2sfDXb#comment

爬取的下面的全部评论：

微博的网页属于Ajax渲染，当我们向下滑动的时候会显示的评论，地址栏的URL不变，需要找到实际的请求URL。

1、右击【检查】，找到【Network】

2、确定每页的内容URL

这里是首页部分

滑动之后显示每页内容的URL；

3、每页的URL地址

从第二页开始的URL地址多的部分是max_id，刚好这个参数的值是前一页的返回内容：

4、介绍第一页的爬取

比如我们可以获取第一个用户的相关信息：

最终我们可以看到第一页爬取的数据展示：

参考上面的逻辑可以爬取到微博下面的全部评论

导入需要的库：

查看我们爬取到数据的基本信息，我们导入前5行数据：

基本信息：查看数据的shape形状，总共是47638行，8个字段，并且不存在缺失值。

将我们爬取到的格林威治形式的时间转成熟悉的标准化时间形式：

国内的省份中北京、广东、上海、江苏都是吃瓜的大省份！

果然：女性真的很爱吃瓜

爬虫页面新浪信息时间

# 上一篇：r语言怎么设置箱式图坐标轴间隔

# 下一篇：Java高级编程有哪些知识呀

给您推荐相同类型的内容：

如何在windows下安装GIT
本文在Windows7下测试成功。安装和设置Git下载Git for Windows，采用默认安装，安装完成后就可以在本地使用Git了。但要将内容放到Github上，必须先在Github网站上注册个账户，然后在本机使用Git创建SSH Ke
求神奇宝贝特别篇主要人物和个城市首领拥有的神奇宝贝
关东地区小智（Red）人物设定：电玩红、绿、蓝、黄、火红、叶绿版男主角姓名意思：红色特殊能力：战斗之人性别：男血型：O型出身地：真新镇年龄：第一章11岁／第二章13岁／第三章14岁／第五章16岁／第六章16岁生日：8月8日（狮子座）登场章
C语言：编写函数fun返回二维数组周边元素之和，咋写？
入门到放弃？“CC++真的太难学了，我准备放弃了！”很多初学者在学完C和C++的基本语法后，就停滞不前了，最终走向“从入门到放弃”。其实，我们初学者最需要的不是HelloWorld，也不是语法知识的堆砌，需要的只是实战项目的磨砺。一个项目
为什么越来越多人偏爱用Go语言做开发？慕课网也越来越多关于go的课程了？
个人认为：1、上手快只要你有其会其他语言，学习go很快。2、go语言非常适合写服务端因为它开源，所以很容易找到你想要的框架，开发效率非常高。3、跨平台你的一个程序可以随意部署。不受操作系统限制，windwos、linux、macos都能
R语言判断是否为null
is.null()R语言中，NA代表位置上的值为空，NULL代表连位置都没有，变量为空。判断语句判断向量中的元素是否没有值：is.na()判断向量是否空值：is.null()isEmpty() 和(list.size() == 0)都是判断
python验证码识别模块
只需要简单几步操作即可拥有两大通用识别模块，让你在工作中畅通无阻。测试图片 test1.png 测试图片 test2.jpg 以上参数两者选其一即可，默认 model_type 为 ModelType.OCR, 若指定 co
国产全自动咖啡机哪个品牌好
国产全自动咖啡机飞利浦品牌好。全自动咖啡机使用热阻板和加热单元进行加热，通常43秒就可以完成从冲至温度到加热温度。有些全自动咖啡机有两个加热系统，它的好处是可以减少你的等待时间。对于全自动咖啡机来说程序设置大体一样，比如杯量控制、温度控
seoul song的介绍
rt含义为“如题”，为中文汉语拼音RuTi的首字母缩写。当今很多帖子，如在wow吧经常看见通常用在邮件或论坛发贴中，一个常见的用法是：当标题已经完全表述了需要表达的内容，人们在正文中仅写RT两字，告诉读者要说的在标题中说完了
python怎么运行
当你创建完.py文件后，而且输入代码，必须告诉Python去执行这个文件。也就是说，从头到尾按照顺序一个接一个地运行文件中的语句。可以通过命令行，从IDE中点击其图标或者其他标准技术来运行Python程序。Python解释器简介：Pyth
go语言适合做什么
go语言适用的领域有：Go语言主要用作服务器端开发，其定位是用来开发“大型软件”的，适合于很多程序员一起开发大型软件，并且开发周期长，支持云计算的网络服务。Go语言作为服务器编程语言，很适合处理日志、数据打包、虚拟机处理、文件系统、分布
r语言如何实现加权计算
wt &lt- c(5, 5, 4, 1)15x &lt- c(3.7,3.3,3.5,2.8)xm &lt- weighted.mean(x, wt)用r语言求正态分布的标准差：产生100个均值为0标准差
单片机应用程序的开发步骤
具体步骤如下：1、首先，开启我们的keil软件，具体的安装步骤就不做太多的介绍了；开启后，点击菜单栏上的Project选项，创建我们的工程，如图所示；2、点击后，弹出图中的窗口，在箭头所指的文本框中输入你的芯片型号进行查找，如果没有需要
新买的电脑初学C语言，但为什么运行程序很慢，要近20秒？
不要放在U盘中运行。不要放在桌面运行。机子配置太差。或者是多系统中，内存被限制在了一定范围内运行程序就会很慢。C语言是一门面向过程的、抽象化的通用程序设计语言，广泛应用于底层开发。C语言能以简易的方式编译、处理低级存储器。C语言是仅产生少
各位大佬，伊莉雅有q版手办吗
有的，Q版手办一般被称为粘土人。关于伊莉雅的粘土人有以下几款：Penguin Parade 伊莉雅斯菲尔.冯.爱因兹贝伦 2014年6月发售，官方售价680日元Banpresto 伊莉雅斯菲尔.冯.爱因兹贝伦,2012年10月发售Ban
学习JAVA去培训机构坑不坑啊，自学不知道有没有什么难度
坑不坑这个问题主要是见仁见智，如果不好好学，在哪你都有被骗的感觉。如果你是零基础，就不要想着自学了，既浪费感情又浪费时间。报培训机构的好处就是：1、知识比较系统，而且实用性比较强2、项目实操经验多，上手快3、公司招聘什么样的人才，就
为什么运维需要会Python开发
Python的特点在于灵活运用，因为其拥有大量第三方库，所以开发人员不必重复造轮子，就像搭积木-样，只要擅于利用这些库就可以完成绝大部分工作。对于运维而言，系统运行过程中变化小，重复性非常高。Python 是高层语言，只需要（编辑-测试-调
JAVA中protected的作用
类NewObject中有protected修饰的方法或者属性，可在同一个包里的子类中实例化NewObject类获得对象，然后可用该对象访问protected修饰的方法或者属性，即操作访问。可在同一个包里的非子类中实例化NewObject类的
如何用python创建文件夹
首先可以用Python的os模块中的exists来判断目录是否存在。python学习网，大量的免费python视频教程，欢迎在线学习！相关推荐：《Python教程》如果目录或者是文件存在则os便会返回TRUE的结果。创建目录可以先用getc
求 kara - super star - 玛丽外宿中韩胜妍.mp3 放在QQ空间的连接地址发到[email protected] 谢谢
经试可用！http:224.cachefile19.rayfile.com37c3zh-cndownload1c132882d7b4908b79e3d0a95e978edapreview.mp3
C语言细胞分裂问题
每次分裂得到的细胞数：前次细胞数+3的(分裂次数)次方,而3的n次方可以用累乘得到11+31+12=1+3*1+3*3=1+3+91+3+9+9*3=1+3+9+271+3+9+27+27*3=1+3+9+27+81...#include&
m语言和c语言有什么区别
编写区别。M语言是大型商业开发软件MATLAB的编程语言，M语言早期是由Fortran编写，后来又使用C语言进行重新编写。M语言是由法国财政部DGFiP（相当于美国税务局IRS）创造的编程语言，用于把税务代号转录成机器可读命令。m语言就是m
Python实现基于遗传算法的排课优化
排课问题的本质是将课程、教师和学生在合适的时间段内分配到合适的教室中，涉及到的因素较多，是一个多目标的调度问题，在运筹学中被称为时间表问题（Timetable Problem，TTP）。设一个星期有n个时段可排课，有m位教师需要参与排课，
r语言怎么对data 进行排序
R中按照列之和进行升序排序：data = data[,order(colSums(data))]R中按照列之和进行降序排序：data = data[,order(colSums(data),decreasing = TRUE)] R语言中，
java中关键字const是什么意思？
在Java中,const是作为保留字以备扩充,同样的保留字以备扩充还有goto. 你可以用final关键字.final也可以用于声明方法或类,被声明为final的方法或类不能被继承一般C里是const java用finalconst是con
python验证码识别模块
只需要简单几步操作即可拥有两大通用识别模块，让你在工作中畅通无阻。测试图片 test1.png 测试图片 test2.jpg 以上参数两者选其一即可，默认 model_type 为 ModelType.OCR, 若指定 co
R语言中更改图的大小比例
基础知识：像素数：图片上的最小成像单位的数目。评价一个设备的像素值，一般使用宽高像素的乘积表示，如1000px * 1500 px 尺寸：指图像打印后的物理尺寸，一般用厘米米或者（英）寸表示,1英寸（inche）=2.54厘米
极客时间的GO语言进阶训练营怎么样？
极客时间的GO语言进阶训练营是很不错，知识内容涉及比较全面，从编程语言到中间件、系统设计再到架构都安排了相关课程，老师们在课程中不讲语法和用法，重点传递设计原理和最佳实践，讲课的过程中贴合工作场景，分享真实的干货案例，启发学员的思维让其自主
为什么运维需要会Python开发
Python的特点在于灵活运用，因为其拥有大量第三方库，所以开发人员不必重复造轮子，就像搭积木-样，只要擅于利用这些库就可以完成绝大部分工作。对于运维而言，系统运行过程中变化小，重复性非常高。Python 是高层语言，只需要（编辑-测试-调
go类型转换
type_name(expression)float跟int可以互转，但是会丢失所有精度。func AppendBool(dst []byte, b bool) []byteAppendBool 根据 b 的值将“t
java能不能写病毒或木马
为了确保病毒或木马能成功执行，没有黑客会选择java编写，就是因为不是每台电脑都装有java虚拟机的原因。其次java.没有象c语言那样方便地操作内存和计算机底层，因java本身就封装好这些操作以防止如c语言那些不可预料的异常。但java肯

推荐阅读

热门文章

最新发布

标签列表

python爬虫：微博评论分析

给您推荐相同类型的内容：