为什么qq空间源代码与爬取到的不一样

2023-02-26 02:46:02Python012

为什么qq空间源代码与爬取到的不一样,第1张

因为页面有些DOM是在js执行之后渲染出来的，你要在右键-页面源码这里看，才是浏览器拿到的页面源码。如果你要爬取的数据是js渲染得到的，那么有两种办法。一种是直接调用浏览器帮你执行js，拿到你希望拿到的数据。这个可以用selenium这个工具实现。另一种是你自己模拟js的执行过程，用python代码实现这段算法，拿到数据

用urllib2

例如：

url = 'http://i.qq.com/'

data = {'name': 'username','password': '123456'}

post_data = urllib.urlencode(data)

req = urllib2.Request(url, post_data)

response = urllib2.urlopen(req)

page_content = response.read()

这个data这里是随便写的，你自己用抓包工具看看是qq空间是什么样子的。

你这种情况，是因为浏览的是动态页面，源码是动态生成的，需要找到那个隐藏的url才能抓取。采用这种方式的网站很多，是为了快速显示相应的内容。解决方法要么找到可以显示内容的隐藏url，要么采用python的插件，将全部的内容显示出来后，读取源码，再抓取。

源码页面你自己内容数据

# 上一篇：2021-04-04 python3集合运算：补集交集并集子集

# 下一篇：c语言培训机构排名

给您推荐相同类型的内容：

Python Pandas 向DataFrame中添加一行一列
在Pandas的DataFrame中添加一行或者一列，添加行有 df.loc[] 以及 df.append() 这两种方法，添加列有 df[] 和 df.insert() 两种方法，下面对这几种方法的使用进行简单介绍。采用 loc[
python中如何判断一个数是否为整数
python中如何判断一个数x是否为整数x是整数，取整后仍是整数，int（x）==x 为Truex不是整数，就是含有小数部分，int（x）！=x 为Trueisinstance()函数&gt&gt&gtisin
ubuntu如何升级python2.7
在ubuntu 的终端中用代码下载最新的Pythonsudo apt-get install python3系统会提示输入Linux 的密码，输入密码后下载刚才下载的Python程序被安装在usrlocallibpython3.5
python中列表的增删改查
关于列表首先需要知道它是一系列按特定顺序排列的元素组成你可以创建包含字母表中所有字母、数字0至9或所有家庭成员姓名的列表；也可以将任何东西加入列表中，其中的元素之间可以没有任何关系。鉴于列表通常包含多个元素，给列表指定一个表示复的名称
C语言中=是什么意思
C语言中的“=”不像我们平时数学中的"="，C语言中的"="是赋值的意思，但C也有像数学中表示等于的符号，它就是"=="意思是相等，==是关系运算符，用来判断两个值大小是否相同，当
C语言中的全局变量和局部变量分别是指什么?
解答问题前，先说明一下，当全局变量和局部变量同名时，要看当前代码所处的作用域，默认使用当前作用域内的同名局部变量。分析你所提供的代码：#include int a = 4全局变量int f(int n){int t = 0static
C语言编写一个程序输出一个正方形
思路：输出正方形即输出正方形的外围就行，外围有个特点就是行列下标必有0或者是正方形的大小减一，输入一个n表示正方形大小，输出一个由*组成的正方形。参考代码：#include &ltstdio.h&gtint main()
怎样在c语言中比较一个数组中元素的大小？
main(){int a[10],b[10],i,j=0,k=0,e=0 for(i=0i&lt10i++)scanf("%d",&ampa[i]) printf("n")
python-docx生成默认有页码的word文档
要求：页码从第1章开始，按阿拉伯数字连续编排。页码位于页面底端，居中书写；虽然在python-docx 0.8.8 (2019-01-07)的版本中已经支持了word文档的页眉页脚的设置，但目前我也尚未找到怎么在页脚中显示页码。
《Python科学计算》epub下载在线阅读，求百度网盘云资源
《Python科学计算》（张若愚）电子书网盘下载免费在线阅读资源链接：链接：https:pan.baidu.coms1JbaLu9aCNl8HtLAqJBCIXw提取码：su9x书名：Python科学计算作者：张若愚豆瓣评分
c语言闰年的判断编程是什么?
四种方法判断闰年：第一种：条件嵌套语句（三个if…else…）。如果普通年能被4整除但不能被100整除，则为闰年，例如2020年为闰年。如果世纪年可被400整除，则为闰年，例如2000年为闰年。第二种则是直接条件判断，if…else
python中变量哪些加引号
python中变量的字符串中含有特殊符号,加单引号。忽略掉单引号内所有特殊字符,包括变量、$,,`和空格 myname='zhu jiasheng' 变量中本身带有单引号,用双引号。使用到变量,保留$和反引号``等的
如何自学Linux下C语言嵌入式编程？详细点谢谢！书籍及开发板用什么的最好
开发板用友善之臂的吧mini2440 连3.5寸屏500块钱的样子有好几张DVD学习光盘这款口碑比较高嵌入式Linux操作系统学习规划ARM+LINUX路线，主攻嵌入式Linux操作系统及其上应用软件开发目标：（1）掌握主流嵌入式微处理
C语言中是如何定义常量的啊
C语言的常量有整数常量，实型常量，字符常量，符号常量等。1、整数常量整数常量是指直接实用的整形常数，又称整形常数或者整数，例如，1，-9等。整数常量可以是长整形、短整型、符号整型和无符号整型。a)八进制数八进制整数必须以0开头，即以0作为八
c语言中如何实现模块化？
C语言中用函数来实现程序模块。模块化程序设计是将一个大的任务分解成若干个小任务，再将小任务分解成更小的任务，直到每一个任务都只完成一个独立功能。这样的每个任务都叫做模块，C语言中模块是用函数来实现的。借助函数来实现程序模块化，把你想实现的
c语言培训机构排名
1、动力节点2、 IT培训网3、北大青鸟4、传智播客5、优就业6、潭州教育7、小码哥8、中软国际9、新华电脑学校10、尚观锦程动力节点专注Java教培12年,12年来多数的生源来自与口碑介绍,至于为什么毕业的
程序化交易里面主流的语言是C++,python是趋势吗?主流的平台软件有...
语言只是工具，各有优势，用自己顺手的就行了，但对于通常的金融交易来讲，大部分语言效率都足够了，不明白为什么一直有这样的争论存在，对于程序而言，执行效率只是其中一个重要的方面，但不是全部，还要考虑开发效率，可维护性，程序健壮性等众多因素。
python字符串操作‘’中间可以为空吗
使用字符串长度判断len(s) ==0则字符串为空if len(username) ==0 or len(password) == 0:#判断输入的用户名或密码是否为空print('用户名或密码不能为空')2、i
如何理解C语言常量和变量
对于基本数据类型量，按其取值是否可改变又分为常量和变量两种。在程序执行过程中，其值不发生改变的量称为常量，其值可变的量称为变量。它们可与数据类型结合起来分类。例如，可分为整型常量、整型变量、浮点常量、字符常量、字符变量、枚举变量、枚举变
python选择结构分为哪几类?每一类的语法格式怎么书写?
分三类：单分支，双分支，多分支。输出用print()在括号中加上字符串，就可以向屏幕上输出指定的文字。比如输出'hello, world'，用代码实现如下：&gt&gt&gtprint('
计算机C语言中的“C”代表什么意思？
计算机C语言中的“C”代表着Combined，结合、组合、合并的意思。C语言是一门通用计算机编程语言，其发展经历了许多的科学家们的加工处理。C语言之所以命名为C，是因为 C语言源自Ken Thompson于1970年发明的B语言，而 B语言
c语言中sum是什么意思
这是自定义关键字，不属于C语言关键字，无固定含义。开发者可以自定义sum，一般用来表示求和变量。举例如下：#include&ltstdio.h&gtint main(){int a,b,suma=1b=1s
开淘宝用得上python吗
做的小的话用不着，做的大的话或许可以用到。Python是一种广泛使用的解释型、高级和通用的编程语言。[1]Python由荷兰数学和计算机科学研究学会的Guido van Rossum创造，第一版发布于1991年，它是ABC语言的后继者，也可
Python GUI项目实战（二）主窗体的界面设计与实现
上一节我们介绍了登录窗体的GUI设计与功能实现，用户的账号和密码校验完成后应当跳转到主窗体内容，这一节我们将具体介绍主窗体界面的设计与功能实现！我们新建一个900x640的窗口，顶部加入图片，下面主体部分创建两个Panedwindow
Python将两个字典合并成一个字典
d1={'tudou':3,'yangcong':1,'mitao':8}d2={'mitao':3,'pantao':5,'wu
c语言算法有哪些
这里整理c语言常用算法，主要有：交换算法查找最小值算法冒泡排序选择排序插入排序shell排序 (希尔排序)归并排序快速排序二分查找算法查找重复算法1.输入语句:scanf("控制格式",接受值列表),其中控制格式常用的有
推荐 8 个炫酷的 Python 装饰器
1、 lru_cache这个装饰器来自functools模块。该模块包含在标准库中，非常易于使用。它还包含比这个装饰器更酷的功能，但这个装饰器是非常受人喜欢的。此装饰器可用于使用缓存加速函数的连续运行。当然，这应该在使用时记住一些关于缓存的
python requests怎么设置重定向
class FakeOut:def __init__(self):self.str=''self.n=0def write(self,s):self.str+="Out:[%s] %sn"%(sel
python 参数列表的分拆的方法？
4.7.4. 参数列表的分拆另有一种相反的情况: 当你要传递的参数已经是一个列表，但要调用的函数却接受分开一个个的参数值。这时候你要把已有的列表拆开来。例如内建函数 range() 需要要独立的 start，stop 参数。你可以在调用函数
python：已安装python，再安装Anaconda，使用import导入找不到模块
电脑已经安装了python2和python3，再按照Anaconda。安装的时候选择使用默认的python版本。安装完成，配置好环境变量。打开命令行，输入conda --version 能正确显示版本号，环境变量配置成功。导

推荐阅读

热门文章

最新发布

标签列表

为什么qq空间源代码与爬取到的不一样

给您推荐相同类型的内容：