python 爬虫 CSS 出现错误IndexError: list index out of range

2023-04-24 22:13:02html-css035

python 爬虫 CSS 出现错误IndexError: list index out of range,第1张

Traceback (most recent call last):

File "D:\Program Files (x86)\JetBrains\PyCharm Educational Edition 1.0.1\helpers\pydev\pydev_run_in_console.py", line 66, in <module>

globals = run_file(file, None, None)

File "D:\Program Files (x86)\JetBrains\PyCharm Educational Edition 1.0.1\helpers\pydev\pydev_run_in_console.py", line 28, in run_file

pydev_imports.execfile(file, globals, locals) # execute the script

File "D:/python/xpth/xpathPractice.py", line 51, in <module>

results = pool.map(spider, page)

File "D:\anzhuang\Anaconda\lib\multiprocessing\pool.py", line 251, in map

return self.map_async(func, iterable, chunksize).get()

File "D:\anzhuang\Anaconda\lib\multiprocessing\pool.py", line 558, in get

raise self._value

IndexError: list index out of range123456789101112123456789101112

出现如上所示的错误：

IndexError 下标索引超出序列边界，比如当x只有三个元素，却试图访问x[5]

你的python爬虫界面和博主的不一样，很可能是因为你所用的python爬虫版本和博主所用的版本不同所致。此外，网页上可能还有一些css代码和javascript代码等对爬虫界面造成影响，你可以尝试更新你的爬虫版本，并根据网页代码来调整你的爬虫设置。你的python爬虫界面和博主的不一样，很可能是因为你所用的python爬虫版本和博主所用的版本不同所致。此外，网页上可能还有一些css代码和javascript代码等对爬虫界面造成影响，你可以尝试更新你的爬虫版本，并根据网页代码来调整你的爬虫设置。

4种方法可以定位爬虫位置：1、传统 BeautifulSoup 操作经典的 BeautifulSoup 方法借助 from bs4 import BeautifulSoup，然后通过 soup = BeautifulSoup(html, "lxml") 将文本转换为特定规范的结构，利用 find 系列方法进行解析。2、基于 BeautifulSoup 的 CSS 选择器这种方法实际上就是 PyQuery 中 CSS 选择器在其他模块的迁移使用，用法是类似的。关于 CSS 选择器详细语法可以参考：http://www.w3school.com.cn/cssref/css_selectors.asp 由于是基于 BeautifulSoup 所以导入的模块以及文本结构转换都是一致的。3、XPathXPath 即为 XML 路径语言，它是一种用来确定 XML 文档中某部分位置的计算机语言，如果使用 Chrome 浏览器建议安装 XPath Helper 插件，会大大提高写 XPath 的效率。4、正则表达式如果对 HTML 语言不熟悉，那么之前的几种解析方法都会比较吃力。这里也提供一种万能解析大法：正则表达式，只需要关注文本本身有什么特殊构造文法，即可用特定规则获取相应内容。依赖的模块是re希望以上回答可以帮助到你。

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：网页中使用了“百度搜索提示框”，引入css文件后提示框就失效。

# 下一篇：CSS样式表代码布局基础教程

给您推荐相同类型的内容：

为什么通过js渲染的元素css不生效
为什么通过js渲染的元素css不生效？答案如下：原因是通过测试，这是因为vue文件中的style标签添加了scoped的原因，而scoped的作用是为了保证这些css样式只会对当前vue文件(组件)生效，但是由于其他vue文件(组件)中也有
桌面图标怎么设置大小?
若是使用的vivo手机，可以参考以下方法Origin桌面探索桌面：可点击桌面变形器，根据喜好设置图标风格与大小；长按图标，点击图标右下角，可定义图标在桌面位置的大小；其他系统桌面：可以进入设置--桌面、锁屏与壁纸---桌面设置--“图标
css3怎么写光晕效果
1， css3圆形光环闪烁效果。2，文件引用：,&ltstyle type="textcss"&gtbody{background: #EF7148}img{cursor:pointer-webkit-
笔记本电脑调节摄像头支架怎么用
笔记本电脑调节摄像头支架的使用方法：1、在使用上需要先将支架打开，一定要注意图标面朝上才是正确的使用方法。&gt2、支架底部也是硅胶的脚垫的设计，能够与桌面契合并且稳固。3、当将笔记本电脑放置上去后，可以起到增高的作用，也能够将电脑
沃尔沃fv电脑板装在什么位置
沃尔沃FV电脑板是安装在发动机舱的发动机控制盒上。根据查询相关公开信息显示，沃尔沃fv电脑板是用来控制发动机的性能的一块板子，实现燃油管理系统，排气系统和发动机启动系统的控制，检测发动机的故障码。【太平洋汽车网】沃尔沃v40气囊电脑板在排挡
为什么js url传的中文乱码
浏览器和服务器之间的编码格式是不同的，要解决乱码问题有三种办法如果是get请求，可以在tomcat根文件下找到一个server.xml文件在其第65行后加上URIEncoding="UTF-8"如果是post请求，可以通
已经有题库怎么利用js自动答题
读取题库将电脑题库txt文档传到手机上,一个方便的做法是将爬取的文档直接放在本脚本文件的文件夹内,然后按照保存脚本文件的方法保存即可按ctrl+shift+p,点击 save on device,即可保存到手机,会存为js文件地址为
div+css怎么个手写法？
用记事本写，格式跟在DW里写一样，只是DW里面有代码提示！而记事本里没有，纯手工写！写完后把文件后缀改成CSS的文件，然后再调用就可以了！手写是很能体现一个人的水平的哟！加油！visualstudiocode怎么写css在Visual St
CSS语法的背景重复
如果需要在页面上对背景图像进行平铺，可以使用 background-repeat 属性。属性值 repeat 导致图像在水平垂直方向上都平铺，就像以往背景图像的通常做法一样。repeat-x 和 repeat-y 分别导致图像只在水平或垂直
笔记本电脑忘记了开机密码怎么办？
1、登录：如果管理员Adminstartor帐号没有设置密码，可以在开机登录界面，左手按Ctrl+Alt，然后右手连按两下Delete键，调出管理员登录框。不要输入任何密码，直接按“确定”就可登录系统。2、修改：进入系统后，打开控制面板，进
CSS样式表代码布局基础教程
CSS样式表代码布局基础教程CSS样式表代码布局基础教程—课程10：外部样式表(一)十、外部样式表外部样式表是把各种样式单独存在一个文件里，供其他多个网页调用，下面我们来看一个练习；1、文本编辑器1）打开记事本或 gedi
村庄中装什么宽带好？
您好：我来回答一下。这个问题需要视你们当地具体网络情况来定。我说说我们这里的网络情况。一开始是电信宽带，电信宽带稳定，网速好，但是电信宽带贵。当时装宽带的不多，我家装过，后来由于外出工作，就没缴费，断了。后来回家，就发现有
苹果手机怎么用数据线连接电脑上网？
以iPhone 手机为例：1、电脑百度搜索“iTunes”，打开iTunes官网。2、点击“下载”，下载iTunes的安装包文件。3、双击下载的iTunes安装文件。4、根据提示安装iTunes。5、将手机用数据线连接到电脑，手机提示是否
相机里的照片怎么传到电脑上去
1、将相机用USB连接到电脑后，打开“计算机（我的电脑）”。双击进入设备。2、点击“浏览文件”。3、进入“StorageMedia”4、根据时间，选择需要导出的照片所在文件夹，并进入。5、找到照片，复制，即可导入电脑~相机怎么传照片到电脑上
JS中如何获取CSS属性
obj.style方法，这个方法只能JS只能获取写在html标签中的写在style属性中的值（style=”…”），看下面代码 XMLHTML代码&lt!DOCTYPE html PUBLIC “-W3CDTD XHTML
认识Vue.js+Vue.js的优缺点+和与其他前端框架的区别
认识Vue.js+Vue.js的优缺点+和与其他前端框架的区别首先，我们先了解什么是MVX框架模式？MVX框架模式：MVC+MVP+MVVM1.MVC：Model(模型)+View(检视)+controller(控制器)，主要是基于分层
如何用JS修改已加载的CSS样式表样式？
js是无法直接修改css文件的，但可以通过取对象的方式修改对象的样式，通常有两种方法：x0dx0a1、改变className，但首先在样式表中预设定样式类。x0dx0a例如：document.getElementById('
JS查找数组指定元素
findIndex它会返回数组中满足提供的函数的第一个元素的索引，否则返回 -1 跟findIndex差不多，只不过是倒序查找观察可以知道findIndex 和findLastIndex的实现原理基本相同，区别只在于查找顺讯，那么
请问怎么自学Lungo Js？用什么浏览器测试？用什么工具开发？用什么服务器发布？手机怎么去访问？
先看介绍:Lungo.jS 是一个使用 HTML5CSS3 和 JavaScript 技术的移动 Web 开发框架。可帮助创建基于 iOS, Android, Blackberry 和 WebOS 平台的应用程序。该框架可利用当前移动设
python纵向制表符怎么用
python纵向制表符用于对齐表格的各列。制表符，属于写法是两个字符的组合，但含义上只是一个字符的情形。它的写法是反斜杠和t字母的组合，即t，t取的是table之意。它的含义是一个字符，叫做制表符。要注意，制表符的写法只有在引号内才起作用
http:js609vip.com登录不上了
址解析服务出问题了。浏览器无法访问解决此问题共有3步，以下是解决浏览器无法访问此页面的具体操作步骤：1、打开Internet浏览器无法访问此页面打开Internet选项。2、点击高级重置浏览器无法访问此页面，选择并点击高级重置。点重置重新打
js固定浏览器大小
&ltSCRIPT language=JavaScript&gt &lt!--var new_width=800你要固定的浏览器宽度var new_height=600你要固定的浏览器高度func
聚氨酯防水涂料与JS防水涂料有什么区别？
js涂料比较稀，呈白色和灰色状，而聚氨酯涂料比较粘稠，呈黑色和棕色状。推荐使用科顺家庭防水的润涂多功能防水涂料R300，其优势有：粘结力强，防水、抗渗性能高；抗拉强度高，延伸性能好，适应基层开裂变形能力强；开桶即用，施工简便、有效缩短工期；
织梦系统，如何给js漂浮图片加关闭按钮和加链接？
&lttitle&gtJS漂浮图片，点击图片后会关闭&lttitle&gt&ltscript language="JavaScript"&gtvar Ymax=8var
仙剑奇侠传7配置要求
仙剑奇侠传7配置要求如下：最低配置：操作系统：Win10(64位）处理器：Intel Core I5-7500AMD R5-1500X内容：8G显卡：Geforce GTX960或其他同级别型号DirectX版本：Direc
电脑升级先换什么好？
现在主机硬件市场虽然是价格透明，供应充足，但想要配置一台全新的游戏主机还是得让不少小伙伴狠心“割肉”，此时，给自己之前的老电脑换个硬件升个级就成为了性价比很高的选择。事实上，大多数DIY玩家都会逐渐更换自己的主机硬件，这样做既能体验到新出硬
CSS flex布局
flex布局是一种无论对于块级元素还是行内元素都可以被采用的布局，且它使用起来也是十分的方便首先是要指定flex布局当我们指定flex布局方式的时候，其属性值 float、clear、vertical-align就失效了
电脑就桌面壁纸曝光过高,其他都没事,这是什么原因
这个问题是因为电脑系统设置的问题，早上同事电脑出现这个问题，百思不得其解。经过各种测试后发现解决方法。如下：1、右击“我的电脑”选择“属性”；如下图2、打开后选择左上角的“高级系统设置”；如下图3、弹出的系统属性选择：“高级”选项里面的性
ios版龙之谷手游怎么在电脑上玩
= = = = = = 推荐 = = = = = = 常见问题解决方案：点击查看 ios与安卓互通吗：点击查看 ios版本公测时间：点击查看 = = = = = = 阅读正文 = = = = = = 龙之谷手游怎么在电脑上玩?龙之谷手游电脑
CSS 中的 :before 和 :after 的一点小知识点
:before 选择器在被选元素的内容前面插入内容。定义中提到，是在被选元素的内容前面插入内容，如下图，div 是一个容器，div 中的内容是testDiv元素，css 中的:before和after都

推荐阅读

热门文章

最新发布

标签列表

python 爬虫 CSS 出现错误IndexError: list index out of range

给您推荐相同类型的内容：