linux下python怎么写爬虫获取图片

2023-02-23 23:44:01Python023

linux下python怎么写爬虫获取图片,第1张

跟linux有什么关系，python是跨平台的，爬取图片的代码如下：

import urllib.requestimport osimport randomdef url_open(url):

req=urllib.request.Request(url) #为请求设置user-agent,使得程序看起来更像一个人类

req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1WOW64rv:43.0) Gecko/20100101 Firefox/43.0') #代理IP，使用户能以不同IP访问，从而防止被服务器发现

'''iplist=['1.193.162.123:8000','1.193.162.91:8000','1.193.163.32:8000']

proxy_support=urllib.request.ProxyHandler({'http':random.choice(iplist)})

opener=urllib.request.build_opener(proxy_support)

opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.154 Safari/537.36 LBBROWSER')]

urllib.request.install_opener(opener)'''

response=urllib.request.urlopen(req)

html=response.read() return htmldef get_page(url):

html=url_open(url).decode('utf-8')

a=html.find('current-comment-page')+23

b=html.find(']',a) #print(html[a:b])

return html[a:b]def find_imgs(url):

html=url_open(url).decode('utf-8')

img_addrs=[]

a=html.find('img src=') while a!=-1:

b=html.find('.jpg',a,a+140) if b!=-1: if html[a+9]!='h':

img_addrs.append('http:'+html[a+9:b+4]) else:

img_addrs.append(html[a+9:b+4]) else:

b=a+9

a=html.find('img src=',b) for each in img_addrs:

print(each+'我的打印') return img_addrsdef save_imgs(folder,img_addrs):

for each in img_addrs: #print('one was saved')

filename=each.split('/')[-1] with open(filename,'wb') as f:

img=url_open(each)

f.write(img)def download_mm(folder='ooxx',pages=10):

os.mkdir(folder)

os.chdir(folder)

url=""

page_num=int(get_page(url)) for i in range(pages):

page_num=page_num-1

page_url=url+'page-'+str(page_num)+'#comments'

img_addrs=find_imgs(page_url)

save_imgs(folder,img_addrs)if __name__=='__main__':

download_mm()1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374

完成

运行结果

python爬图片报错 [Errno 13] Permission denied: 'D:\\python\\test2'，是代码输入错误造成的，解决方法如下：

1、首先在网页上抓取图片时open函数有时会报错，如图。

2、然后，根据提示找到错误代码处进行查看，是open函数出了问题。

3、再仔细看这个部分报错的文件名称，发现有个*号，问题就找出来了。

4、使用.replace('*','')将*号替换，就可以了。

5、然后再次运行该代码，最后，图片抓取完成，就不会再报错了。

报错图片代码我的函数

# 上一篇：用R语言怎么计算两个连续变量的协方差

# 下一篇：c语言可以用来做什么

给您推荐相同类型的内容：

零基础的学习哪个编程语言好？
首先，我觉得无论你以后想从事IT的哪方面，都可以先学C语言。C语言是一门通用计算机编程语言，应用非常广泛。C语言提供了许多低级处理的功能的同时仍然保持着良好跨平台的特性，以一个标准规格写出的C语言程序可在许多电脑平台上进行编译，甚至包含一些
C语言经典100例，小球弹跳的问题的正确答案是多少，谢谢，悬赏！
#include&ltstdio.h&gtvoidmain(){float s=100,h=100,t=0int i=2,nprintf("请输入弹跳次数:")scanf("%d&q
python难学吗？
对比其他的编程语言来说，Python算是比较好学的语言，Python语言简单、优雅、容易上手，初学者的首选，对0基础人员也非常友好，学习Python可以从事多个领域的工作。Python提供了高效的高级数据结构，还能简单有效地面向对象编程。P
c语言编译没有错误,连接有错误是怎么回事?
1 编译阶段，执行的是对单个文件的转换，从源代码转换成二进制文件。2 链接阶段，将每个源文件转成的二进制文件，及相关的系统库文件共同打包生成可执行文件。3 从定义上可以看出，链接阶段，出现错误有两种可能：1) 函数中引用了不存在的函数。2)
C语言是什么概念？
C语言是一门通用计算机编程语言，广泛应用于底层开发。C语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。尽管C语言提供了许多低级处理的功能，但仍然保持着良好跨平台的特性
python配置环境变量
首先鼠标右键此电脑，选择属性；然后点击高级系统设置，点击环境变量；接着点击path进行编辑，在path中添加上python的安装路径；最后点击确定。工具原料：windows7系统python3.9版DELL G3电脑。1、右键点
yolov5是图像处理技术吗？
YOLOV5可以说是图像处理技术，但更准确来说是一种单阶段目标检测算法，机器视觉任务，常见的有分类、检测、分割。而YOLO正是检测中的佼佼者，在工业界，YOLO兼顾精度和速度，往往是大家的首选。延伸：YOLO将对象检测重新定义为一个回归问题
求助！R语言用条件循环求和
x= 0for(i in 1:999){ if(i%%3==0 | i%%5==0) x=x+i}x求余的符号是%%，而不是整除你的思维太像C，只要一个if，一个条件就行i也不用叠加，会自动叠加的mean_24 &lt- f
零基础学Python，从入门到精通需要多长时间
如果想从零基础到入门，能够全职学习（自学），那么一个月足够了。非全职（自学）的话这个时间就可能更长，如果是自学，从零基础开始学习Python大致需要半年到一年半的时间。如果有编程语言的基础，入门还是很快的，用Python语言写一些简单的应用
有学者提出了"mooc可以逐步取代学校教育"的设想.然而，在线学习真的发生了吗
从MOOC到SPOC：两种在线学习模式成效的实证研究▲马秀麟内容提要：随着教育信息化的深入，MOOC、SPOC等新型教学理念深受教育工作者的关注。然而，基于MOOC和SPOC的学习成效到底如何？在线自主学习真的发生了吗？课题组从翻转课堂模式
如何编写使电脑死机的C语言程序
#include&ltconio.h&gt#include&ltstdio.h&gt#include&ltstdlib.h&gt#include&ltdos.h
python代码翻译成java
import java.util.ArrayListimport java.util.List** ** 33行，add的值是对象的话，定义list就不用String，用对象， * 同样38行，可以分别取对象的值，如果想要数组的话，再
R语言之生信⑦Cox比例风险模型(单因素)
原文: R语言之生信⑦Cox比例风险模型(单因素)====================================== 在前一章（TCGA生存分析）中，我们描述了生存分析的基本概念以及分析和总结生存数据的方法，包括：1.
Python自动抢红包，超详细教程，再也不会错过微信红包了
提到抢红包，就不得不提Xposed框架，它简直是个抢红包的神器，但使用Xposed框架有一个前提条件：手机需要root，对于苹果手机的话就需要越狱了。现在的手机想要root或越狱并不容易，同时这会对手机安全性带来一些风险，抢红包本身只是个
C语言数据溢出
有符号int型数据的取值范围是-32768~32767,2个字节总共16位，第一位为符号位，正数的话第一位为0，负数则为1，整数的取值最大是第一位为0，其后的十五位全为1，算过来也就是32767，如果如题所说，加上1之后，第一位变为1，其余
如何用python写布隆过滤器
下面的是网络上找到的python的布隆过滤器的实现.#!usrlocalbinpython2.7#coding=gbk'''Created on 2012-11-7@author: palydawn&
R语言区间估计和置信区间
实验内容一 1.固定样本量和,观察重复次数100、200和400时置信区间包含真值的频率是否接近置信度 2.设置，其他保持1不变，重复1，观察模拟结果；并观察与1中置信区间长度对比效果（随的变化） 3.将1中
R语言怎么输入一个自定义矩阵?求R大神交流
1、先在R中创建简单的矩阵，取名为my_matrix2、现在对每一行进行求和，要使用到apply函数。apply族函数有很多，在平常的使用中，用到最多的就是tapply函数，第一个参数x是数据；第二个参数index是索引，就比如是分组的标准
R语言面向对象
对事物越了解，就能够越好的驾驭这种事物。 R语言有四种面向对象的系统，一般而言，使用其中最简单的一种就已经足够了。本文介绍S3，和S4的使用 S3是R中第一个，也是最简单的oo系统，S3不是非常正式，但是其保有一种极简主义的优
R语言C50为什么运行不出来
可能是代码有问题。如果只是建立模型的那一行代码跑的很慢，如果建立模型的代码本身没有提供并行计算功能，部分模型可以尝试把公式换成则分别传入x=，y=参数，多数模型无法加速。再除非有其他R包，可以建立同样的模型，并且速度更快。R语言是集统计分析
python书籍推荐
python书籍推荐有：《Python编程：从入门到实践》《Head-First Python(2nd edition)》《“笨方法”学Python》《Python程序设计（第3版）》《像计算机科学家一样思考Python（第2版）》。一、
Python爬虫是什么？
爬虫一般指网络资源的抓取，通过编程语言撰写爬虫工具，抓取自己想要的数据以及内容。而在众多编程语言之中，Python有丰富的网络抓取模块，因此成为撰写爬虫的首选语言，并引起了学习热潮。Python作为一门编程语言而纯粹的自由软件，以简洁清晰的
python 运行cmd系统命令
eg：os.system('ls') 这个会直接给出结果，但是没有办法进行进一步的保存和处理 2.os.popen(cmd) eg：str = os.popen("ls").read(
r语言怎么将修改存入原来的数据
r语言修改存入原来的数据的方法是使用names函数自定义修改数据列变量的名称、一次性修改dataframe所有数据列的名称。在数据处理分析过程中，分类变量的值有时候是试用数值来表示，从直观上并不能理解其含义，必须要有赋值对照表才能辅助理解。
C语言蟠桃问题
#include&ltstdio.h&gtint main(){ int n while(scanf("%d",&ampn)!=EOF) {if(n==0)breakint s=1fo
Python字典嵌套字典排序，该怎么处理？
感觉这个需求有些许问题，因为通常对比排序的都是同一类型的数据，譬如aaa代表是年龄，bbb代表的是工资，等等... 所以不会拿自己的年龄和工资作一次排序。# 要做的话，可以手动给它并成一个新列‘sort_key’。 obj就是你最外层的a
R语言得到了模型，怎么预测，比如我要预测2013时候的数据
预测的话，应该用接下来的时间，所以应该是预测2014,2015....程序如下：new&lt-data.frame(year=2014)lm.pred&lt-predict(z,new,interval="p
怎么用Python实现时间加减运算？
import timeimport datetime# 将时间str转化为普通时间类型，用于计算startTime = datetime.datetime.strptime(startTime,"%Y-%m-%d %H:%M:%S
c语言可以用来做什么
一、嵌入式软件项目C语言是比较靠底层的语言，和设备直接打交道比较多，linux操作系统的源码绝大部分是C语言搞定。芯片和底层驱动基本上也是C语言，大家在招聘简章上的驱动工程师最基本的要求就是掌握C语言。常见的底层库比如网络接收，底层图形绘制
python怎么安装？
python安装需要下载对应电脑位数的软件，按提示安装之后，需要进行测试安装是否正确，具体内容如下：1、从Python官网中找到下载菜单，下载Windows环境下最新Python版本。2、双击python-3.6.4.exe安装程序，勾选

推荐阅读

热门文章

最新发布

标签列表

linux下python怎么写爬虫获取图片

给您推荐相同类型的内容：