使用python爬取网页，获取不到图片地址

2023-02-23 15:40:02Python015

使用python爬取网页，获取不到图片地址,第1张

这个大图片是在点击之后用 JS 控制加载的。

你可以看看 js/js.js 这个文件，253 行：

function changeImg(){

jQuery("#bitImg").attr('src','p/p'+pictID+'/'+indexNum+'.'+jpgPng)

}

其实大图的规律很好找，下面缩略图列表的 src 可以用 #variContent >li >img 取到，可以在源码中的 107 行找到：

view-source:http://pictogram2.com/?p=2315

缩略图列表地址长这样：

/p/p0997/tn/1.jpg

/p/p0997/tn/2.jpg

/p/p0997/tn/3.jpg

...

如果要获取大图，只要去掉“tn”这一段就可以：

/p/p0997/1.jpg

/p/p0997/2.jpg

/p/p0997/3.jpg

...

然后拼接域名在前面，GET 下来就是大图，比如第一个大图链接：

第一个大图地址

不过，你如果仅仅只是想要抓那个站的全部素材，穷举“p0997”这一段的序号（比如改成“p0098”，这个应该是图集的 ID），并且遍历最后一段的图片序号，扩展名可能是 jpg 也可能是 png，从 1 开始（“1.jpg”，“2.jpg”...）直到返回 404 停止。

思路大概是这么个思路，不过话说回来，你这么爬人家素材真的道德吗？

你好！你的错误原因在于html页面获取到的img标签src属性中的链接，可能是因为src中的url格式是这样的：

这样获取到的链接都没有带上协议：http或者https。而导致程序抛出ValueError的错误异常。

因为正常的url格式应该类似这样的：https://www.baidu.com/

即协议://用户名:密码@子域名.域名.顶级域名:端口号/目录/文件名.文件后缀?参数=值#标志

参考网页链接

可将代码中第一个for循环中download_links.append修改为：

for pic_tag in soup.find_all('img'):

pic_link = pic_tag.get('src')

download_links.append('http:' + pic_link)

python爬图片报错 [Errno 13] Permission denied: 'D:\\python\\test2'，是代码输入错误造成的，解决方法如下：

1、首先在网页上抓取图片时open函数有时会报错，如图。

2、然后，根据提示找到错误代码处进行查看，是open函数出了问题。

3、再仔细看这个部分报错的文件名称，发现有个*号，问题就找出来了。

4、使用.replace('*','')将*号替换，就可以了。

5、然后再次运行该代码，最后，图片抓取完成，就不会再报错了。

大图第一个报错图片链接

# 上一篇：如何使用R语言中的Performance Analytics包

# 下一篇：苏牧幼犬怎么识别好坏

给您推荐相同类型的内容：

Dior999和Mac rubywoo哪个更适合黄皮？
Dior999和Mac rubywoo都属于正红调口红，但是dior则更加滋润一些。黄皮选择dior更适合，不论薄涂还是厚涂都非常好看。Dior999:质地上更滋润，更易于涂抹。是偏橘调的大红色。很适合暖黄皮，轻松就涂出很有气场的感觉！Di
什么是量化交易？
量化交易是指以先进的数学模型替代人为的主观判断，利用计算机技术从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略，极大地减少了投资者情绪波动的影响，避免在市场极度狂热或悲观的情况下作出非理性的投资决策。时间序列（time
ubuntu ruby怎么变1.9.3
在ubuntu 10.10 中默认安装的是1.8.7,但是1.9.3比较好,所以换了.如果要安装rails,执行6.7步.按以下步骤即可安装:1.安装 RVM： $ curl -L get.rvm.io | bash -s stable2.
java 文件写入后如何覆盖之前的内容怎么办啊？
解决方案你的意思就是不覆盖之前的内容，追加写到文件里面那就FileWriter a=new FileWriter("d:as.txt")改成 FileWriter a=new FileWriter("d:
java中什么是静态方法
静态方法是使用static关键字来修饰的方法，如：publicclassDog{publicstaticvoidshow(){}}这里的show()就是一个静态方法，它有全局方法的特点。静态方法的调用不需要对象，可以用类名直接调用，如：Do
用go语言写一个简单的加减乘除的代码，急求在线等
*Note:YourchoiceisCIDE*#include"stdio.h"#include"stdlib.h"#include"ctype.h"intn=0charrec
C语言如何画图
framebuffer(帧缓冲)。帧的最低数量为24（人肉眼可见）（低于24则感觉到画面不流畅）。显卡与帧的关系：由cpu调节其数据传输速率来输出其三基色的配比。三基色：RGB（红绿蓝）。在没有桌面和图形文件的系统界面，可以通过C语言的编
如何用python做一个设备运维软件
Python开发的jumpserver跳板机jumpserver跳板机是一款由Python编写开源的跳板机(堡垒机)系统，实现了跳板机应有的功能。基于ssh协议来管理，客户端无需安装agent。企业主要用于解决：可视化安全管理特点：完全
谁能推荐本JAVA入门的经典书籍？？
推荐一些JAVA入门的经典书籍，知识点全面，系统的讲述了JAVA编程1，《Head First Java》java入门书籍《Head First Java》是本完整的面向对象（object-oriented，OO）程序设计和Java的学习指
怎么用java的相关类去画一个柱状图
可以使用java第三方JFreeChart的api：具体import java.awt.Colorimport java.awt.GradientPaintimport org.jfree.chart.ChartFactoryimport
C语言的自加自减到底从函数哪里开始，从哪里结束？
我们一行一行分析：for (x = 5x &gt0x--) 从x=5开始,当x&gt0的值为false时停止循环。每次循环后x自减。if (x-- &lt5) printf("%d", x
r语言和sas哪个更适合制造行业的数据分析
你好，是这样的：[注]：这里仅仅讨论楼主所问的R和SAS两种软件简介：R与SAS都属于统计数据分析软件，R与SAS相比，R具有免费开源、应用广泛、可扩展度高等优点；SAS则属于模块化、集成化的软件，成本很高，但是能满足现有统计数据分析
c语言NULL是什么意思？
朴素的0值或者无类型的0值（void 0）计算机语言中为了确定数据宽度（占用字节数）以及数据编码，一般都是有类型定义的，比如C语言中bool为8位逻辑值（单字节），int 为16位整数（双字节），long 为32位整数（4字节），floa
计算机语言有哪些
问题一：计算机语言有哪些？怎么分类？计算机语言（Computer Lnguage）指用于人与计算机之间通讯的语言。计算机语言是人与计算机之间传递信息的媒介。计算机程序设计语言的发展，经历了从机器语言、汇编语言到高级语言的历程。
Ruby Rose 剪发视频的背景音乐是什么
Ruby Rose剪发视频《Break Free - Ruby Rose》中的背景音乐是Butterfly Boucher演唱的《It Pulls Me Under》。歌名：It Pulls Me Under演唱：Butterfly Bou
go是什么编程语言？主要应用于哪些方面？
Go语言由Google公司开发，并于2009年开源，相比JavaPythonC等语言，Go尤其擅长并发编程，性能堪比C语言，开发效率肩比Python，被誉为“21世纪的C语言”。Go语言在云计算、大数据、微服务、高并发领域应用应用非常广
r语言arma-garch怎样预测
原文链接：http:tecdat.cn?p=20015本文将说明单变量和多变量金融时间序列的不同模型，特别是条件均值和条件协方差矩阵、波动率的模型。均值模型本节探讨条件均值模型。iid模型我们从简单的iid模型开始。iid模型
Python之爬虫框架概述
丨综述爬虫入门之后，我们有两条路可以走。一个是继续深入学习，以及关于设计模式的一些知识，强化Python相关知识，自己动手造轮子，继续为自己的爬虫增加分布式，多线程等功能扩展。另一条路便是学习一些优秀的框架，先把这些框架用熟，可以确保能够应
python怎么输入一个列表输出后事是列表0
Python中如何input⼀个列表并且print打印输出该列表Python要从键盘连续输⼊⼀个数组，并⽤空格隔开，Python中的实现⽅法如下：str = input(‘以空格为间隔连续输⼊⼀个数组:’)然后在键盘中输⼊，会得到的str为
牛顿迭代方法
牛顿迭代法（Newton's method）又称为牛顿-拉夫逊（拉弗森）方法（Newton-Raphson method），它是牛顿在17世纪提出的一种在实数域和复数域上近似求解方程的方法。中文名牛顿迭代法外文名Newton�
RIA应用，选择哪个python框架比较合适
这个问题很难回答，Sinatra vs Flask的最主要差别，其实是Ruby和Python的差别。当然Flask要比Sinatra重一些，社区更完善，文档更多，扩展性更强。Sinatra本身如果要应用在中型以上的项目，要自己做很多boil
r语言模型评价的方法有哪些，如何选择
其实tsdiag()就是检验模型的残差是否自相关。可以把你的模型残差调出来用Boxtest()函数检验是否自相关，也可以用acf()函数看看滞后阶数的图形是否存在自相关！chisq.test()这是R自带的函数原假设H0: p1 = 5
GM（1，n）的R语言代码，有会编的给一个！！
#灰色预测模型GM(1,1)#用法：#假设数列1 2 3 4 5.5 6 7.5 为已知数据，你要预测后面3项，gm11([1 2 3 4 5.5 6 7.5],10) # 10=7+3# 序列输入格式为：x&lt-c(1,2,3,
苏牧幼犬怎么识别好坏
1.皮毛:幼犬身上的胎毛要均匀，颜色要鲜艳分明，证明狗狗健康2.腰:不可弓腰，弓要的狗狗很不健康，至少是有虫子。3.尾:不可夹尾。即使是你拿起狗狗，尾也不能夹着。4.眼睛、鼻子、嘴、耳朵、PP等要清洁，无污垢。5.舌头:颜色要鲜艳，幼犬口中
有哪些好的Python IDE
IDE是开发者创建程序时所使用的软件包，它可以通过简单的用户界面集成多个高度关联的组件，从而最大化提升开发者的生产效率，本质上，IDE是一种改进代码创建、测试和debug流程的工具，它使这些工作更加简单。IDE使用的工具包括：文本编辑器和
请教关于python的raise使用的问题
python中的异常异常是指程序中的例外，违例情况。异常机制是指程序出现错误后，程序的处理方法。当出现错误后，程序的执行流程发生改变，程序的控制权转移到异常处理。Exception类是常用的异常类，该类包括StandardError，Sto
java中，什么是静态方法？
首先静态方法是用static来修饰的静态方法就是可以不通过生成类的实例直接来调用的举个简单的例子：classA{publicstaticvoida(){System.out.println("A被调用")}publicv
python跨模块调用函数的问题？
有什么办法省略掉那些被调用函数的参数？也就是func2只想在调用是传入一个c。那么func2在定义的时候必须喂饱func1，也就是func2在调用 func1时，当前作用域中要有a,b。明显图中是没有做到的，没有实际abb可以试试在这个
怎么用java的相关类去画一个柱状图
可以使用java第三方JFreeChart的api：具体import java.awt.Colorimport java.awt.GradientPaintimport org.jfree.chart.ChartFactoryimport
c语言1u是什么意思
u表示该数字是无符号类型。不知道你书上是什么运行平台，我用的vs2013，-0u这个写法是会报错的。而且你那个程序要正确运行的话，传递的应该是-1，而不是-0，因为补码表示法里，-1就是0xffffffff（假设是32位的）。这个程序没问题

推荐阅读

热门文章

最新发布

标签列表

使用python爬取网页，获取不到图片地址

给您推荐相同类型的内容：