如何用Python爬取数据？

2023-02-25 00:14:02Python018

如何用Python爬取数据？,第1张

方法/步骤

在做爬取数据之前，你需要下载安装两个东西，一个是urllib,另外一个是python-docx。

请点击输入图片描述

然后在python的编辑器中输入import选项，提供这两个库的服务

请点击输入图片描述

urllib主要负责抓取网页的数据，单纯的抓取网页数据其实很简单，输入如图所示的命令，后面带链接即可。

请点击输入图片描述

抓取下来了，还不算，必须要进行读取，否则无效。

请点击输入图片描述

接下来就是抓码了，不转码是完成不了保存的，将读取的函数read转码。再随便标记一个比如XA。

请点击输入图片描述

最后再输入三句，第一句的意思是新建一个空白的word文档。

第二句的意思是在文档中添加正文段落，将变量XA抓取下来的东西导进去。

第三句的意思是保存文档docx，名字在括号里面。

请点击输入图片描述

这个爬下来的是源代码，如果还需要筛选的话需要自己去添加各种正则表达式。

python爬图片报错 [Errno 13] Permission denied: 'D:\\python\\test2'，是代码输入错误造成的，解决方法如下：

1、首先在网页上抓取图片时open函数有时会报错，如图。

2、然后，根据提示找到错误代码处进行查看，是open函数出了问题。

3、再仔细看这个部分报错的文件名称，发现有个*号，问题就找出来了。

4、使用.replace('*','')将*号替换，就可以了。

5、然后再次运行该代码，最后，图片抓取完成，就不会再报错了。

请点击图片报错数据函数

# 上一篇：golang 返回值是bool值怎么判断

# 下一篇：初学Java需要掌握哪些基础知识

给您推荐相同类型的内容：

在 python 项目中如何记录日志
写本文的目的是我在写 python 项目的时候需要记录日志，我忘记怎么处理了，每次都需要去网上查一遍，好记性不如烂笔头，这里把查阅的内容记录下来，方便以后查找。 python 项目中记录日志，可以使用 logging 模块，lo
关于李小狼的配音演员
《魔卡少女樱》:熊井素子（Kumai Motoko）英文：Kumai Motoko性别：女生日：9月8日籍贯：东京都身高：156CM血型：AB型星座：处女座隶属：81 PRODUCE主要经历：熊井素子是反串少年角色的又一位女性声优。她最为国
求问python中 %的用法
%常见的两种用法：1、数值运算 1 % 3 是指模运算, 取余数（remainder）&gt&gt&gt7%212、字符串操作 'abc %s' % 'abc' �
R语言相关性分析
1. R语言自带函数cor(data, method=" ")可以快速计算出相关系数，数据类型：data.frame 如data.frame为：zz, 绘图如下：a. single protein：线性
如何更改c语言窗口的背景颜色与字体颜色
在VC下，使用system("color a"),增加头文件#include &ltstdlib.h&gt，其中a表示颜色属性，颜色属性由两个十六进制数字指定 -- 第一个为背景，第二个则为前景。每个数字
求高人帮弄个英文名~谢谢各位大大~
最好根据你的性格选英文名，别人才能记忆深刻。再有就是尽量选个首字母靠前的，因为外国人名都是按字母顺序排列，那样你会抢占很多先机。下面都是，自己选：男子英文名字释义AARON(希伯来)启发的意思，AARON被描绘为不高但英俊的男人，诚实刻苦具
python docx 使用总结
本文将总结之前在使用 python-docx 包处理 word 文档时的一些理解与经验。安装引入 python-docx 将整个文章看做是一个 Document 对象官方文档 - Document ，其基本结
知道Ruby这个单词的意思吗
作名词意思是：1. 红宝石红宝石制品2. 红宝石色,暗红色[U]3. 红葡萄酒[U]4. (脸部的)红酒刺[C]做形容词意思是：1. 红宝石色的做动词意思是：1. 把...染成红宝石色使带有红宝石色罗马红宝石葡萄的品种只有一种。在日本，因为
Java中类的命名规范是怎样的？
在java中，自有一套命名规则，下面我就大概的说一下,希望对你能有用. x0dx0a包名：包名是全小写的名词，中间可以由点分隔开，例如：java.awt.eventx0dx0ax0dx0a类名：首字母大写，通常由多个单词合成一个
北大青鸟java培训：为什么说学java技术非常有发展前途？
经常听见有人这样说：现在JAVA开发工程师前途何在，到底有没有前途呢？怎样才能做一个好的JAVA工程师，我的路应该如何去走。我是新手，不知道这个专业怎么样，看见好多人都在埋怨软件开发辛苦、挣得少，事实如此吗？现在我对JAVA是否有前途这样的
ruby是什么意思 ruby的意思
1、ruby的意思：n.红宝石深红色adj.红宝石的红宝石色的2、ruby的读音：英[ˈruːbi]美[ˈruːbi]3、[例句]The crown was set with precious jewels ─ diamonds,
golang 怎么定义可变参数的函数
golang定义可变参数的函数方法是： —- 采用ANSI标准形式时，参数个数可变的函数的原型声明是：type funcname(type para1, type para2, …) —- 这种形式至少需要一个普通的形式参数，后面的省略
Java简历中工作经验怎么写
错误示范：1、java后台开发2、前端编写正确范例：1、java程序开发岗位，主要负责：代码编写、数据库操作、sql语句优化、wsdl技术调用接口、生成接口等。2、本身掌握的前端技术加上工作期间积累的html5和css3知识，会同
java中14位时间戳怎么获取
按你描述，应该想要的是Unix时间戳，即当前时间到1970年1月1日0:0:0的毫秒数据。在java里面Data类型可以直接用API获取。SimpleDateFormat df = new SimpleDateFormat("yy
有一部英文电影男主角是弹小提琴女主角是跳芭蕾舞的
《舞力重击》High Strung靠奖学金入学的芭蕾舞者Ruby（琦南·卡帕饰)，第一次来到纽约，始终觉得自己与同学格格不入；英国小提琴手Johnnie(尼可拉斯·格拉辛饰)，飘洋过海来地铁站演奏，只为追寻自我的梦想。一场在地铁站上演的
golang的线程模型——GMP模型
内核线程（Kernel-Level Thread ，KLT）轻量级进程（Light Weight Process,LWP）：轻量级进程就是我们通常意义上所讲的线程，由于每个轻量级进程都由一个内核线程支持，因此只有先支持内核线程，才能有
《独一无二的伊凡》好词好句有哪些？
1最终动物获得的自由还是有限的。2它没有回到故乡，而是到了一个动物园，实际上是更大的笼子。3但至少它比过去自由许多，它有了伙伴、同类不在孤单。4这或许就是它追求的全部。简单，幼稚，甚至可笑。但的确是真实且坚定的。即使被奴役、
go语言 md5加密的密码怎样解密
理论上是不能破解的，因为md5采用的是不可逆算法。有的网站上提供MD5解密，是因为有大量的存储空间来保存源码和加密后的密码，当解密时就是一个查询的过程，稍微复杂点的查询就无法完成。编写命令行程序时，可以使用任何接受io.Reader的函数从
c语言指数怎么表示？
用pow（）函数如：#include &ltstdlib.h&gt#include &ltmath.h&gt#include &ltconio.h&gtvoid main(){p
为什么说JAVA现在很热门？
在互联网行业的推动下，其中的一些IT编程技术成为了当今主流行业。很多小伙伴也想抓住互联网在未来的发展机会，让自己在这个时代有所成就，所以大家把目光指向了目前IT行业中比较火爆的java和大数据编程开发。但是，想要实现自己的理想就必须要掌握相
用c语言编写问题:马老师在某银行有10000元存款,银行年利率2.5%,计算10年后银行应支付多少?
#include&ltstdio.h&gtdouble fun(double p,double i,int n){double f=pint mfor(m=nm&gt0m--)f*=(1+i)return f}voi
python中怎么让前5个升序,后五个降序，派Python中输入十个数字，怎么让前五个升序？
分成两个列表分别排序，代码如下：s = input().split()l1 = [ int(x) for x in s[:5] ] # 前5个数字l2 = [ int(x) for x in s[-5:] ] # 后5个数字l1.s
如何用r语言比较多个个体概率
通过使用r语言，对多个个体概率进行统计、比较。1、对单个个体进行概率分析，可以利用二项分布概率、泊松分布概率，对个体概率进行统计、分析；2、创建个体概率分布图形，对多个个体概率进行分析、比较。r语言输入多组数据步骤如下：1.while(sc
Go语言——sync.Map详解
sync.Map是1.9才推荐的并发安全的map，除了互斥量以外，还运用了原子操作，所以在这之前，有必要了解下 Go语言——原子操作go1.10srcsyncmap.go entry分为三种情况：从read中读取k
北大青鸟java培训：北大青鸟颁发的证书如何？
北京阿博泰克北大青鸟信息技术有限公司（简称“北大青鸟APTECH”）由北大青鸟集团与印度阿博泰克公司（APTECH）合资成立，是一家专业的IT职业教育公司，由计算机、计算机系的杨芙清院士创办。北大青鸟APTECH优异的业绩赢得了社会的认可，
for（意思为因为时）的用法是什么
for的意思是因为时，是连词，只要for的后边接的是句子，前面就要加逗号。例如Icannotgothere,foritisrainninghardnow.1、 string的定义Golang中的string的定义在reflect包下的val
语c怎么玩？
你可以先去百度一下，了解清楚“语C”到底是个什么东西，了解一下各个名称是啥意思。从小白变小黑。随后找到语C群，一般新人么，大家看到了还是会很热情的嘛，多多观察别人是怎么语C的，自己也就会慢慢学会了~原创语C最方便，因为限制不会太多，更可以本
c语言的基本类型数据有哪几种
1、整型int2(或4)同短整型(或长整型)2、短整型short2-32768~327673、长整型long4-2的31次方~2的31次方-14、无符号整型unsigned[int]2(或4)同无符号短整型(长整型)5、无符号短整型
Python中的元组(Tuple)
在Python中，元组(Tuple)与列表(List)类似，也是一个有序的序列，但元组是一个不可变对象，其一旦初始化后便无法进行修改。一般在创建元组时，分为创建空元组和非空元组，其创建方式如下：从上面可以看到，我们只需要把元组的
JAVA排列组合算法如题：用x、y，求出指定长度的所有排列组合。
按照你的要求编写的求x,y指定长度的所有排列组合的Java程序如下import java.util.ArrayListimport java.util.Listpublic class EE { public static void co

推荐阅读

热门文章

最新发布

标签列表

如何用Python爬取数据？

给您推荐相同类型的内容：