Python里怎么用find找出HTML里需要的资料(不用re模块和beautifulSoup）

2023-02-28 05:39:02html-css017

Python里怎么用find找出HTML里需要的资料(不用re模块和beautifulSoup）,第1张

你可以看一个python自带的源代码。叫sgmlparser.py，那个解析方法又叫平面解析方法。参考它的算法用find就可以解析出所要的资料。

其实用find速度更快。按理比re要快不少。只需要找到头与尾就可以。只是因为find相对比较固定，没有re那么灵活，所以适应性差些。经常要变更。比如你找一个class="id_xxx"这样的内容用find就很费劲。

你先做一个类。它能封装你查找到起点，终点。查找区间。然后内部使用find做查找。实现类似findall, search, subplace, like等功能。其实也不难。

只是如果做得太复杂了。效率可能受影响，那么你可以使用cython做成C语言的格式，效率就不受影响了。

$(data).find(“#page_nav a”).attr(“href”)

表示从data节点开始向内查找id为page_nav下的a标签，data必须是一个可供选择器选择的表达式，例如标签名、ID、Class等。

因此你可以这样写：$(“#page_nav a”).attr(“href”)或$(“#page_nav”).find("a").attr(“href”)

如果还是不行，你可以用firebug或chrome的开发人员工具，打断点或用console.dir输入你选择的对象，所有问题一目了然。

//查找html文档中的超链接元素

$a = $html->find('a')

//查找文档中第(N)个超链接，如果没有找到则返回空数组.

$a = $html->find('a', 0)

// 查找id为main的div元素

$main = $html->find('div[id=main]',0)

// 查找所有包含有id属性的div元素

$divs = $html->find('div[id]')

// 查找所有包含有id属性的元素

$divs = $html->find('[id]')

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：BFC IFC GFC FFC的理解

# 下一篇：js获取元素高度怎么写呢？

给您推荐相同类型的内容：

python能开发游戏吗？
能，但不适合。用锤子能造汽车吗？谁也没法说不能吧？历史上也确实曾经有些汽车，是用锤子造出来的。但一般来说，还是用工业机器人更合适对吗？比较大型的，使用Python的游戏有两个，一个是《EVE》，还有一个是《文明》。但这仅仅是个例，没有广泛
怎样用CSS实现图片翻转
以实现一张图片双面翻转为例：方法一：1、实现CSS样式的方法代码如下。2、实现前端布局的方法代码如下。3、实现图片翻转CSS样式代码如下。方法二：1、实现正反面效果的HTML的方法代码如下。2、实现CSS样式的方法代码。3、然后实现竖
html select控件如何正确的获取选中的option?
你问的是不是用js怎么获取选中的option值？x0dx0a一：javascript原生的方法x0dx0a1:拿到select对象： varmyselect=document.getElementById("test&
关于go.htm?u=谁懂？？
你需要一个go.htm文件别人的整站代码，你应该知道那个站的域名吧？去打开http:www.aaa.comgo.htmgo.htm保存下来，再把go.htm这个文件上传到你的网站根目录！你这样的程序并不复杂，在现有的系统上只需要修
字重什么是字体设计或者说字体的“字重”
字重（weight），是指相对于字高度的笔画粗细（stroke width）程度。一个字体（typeface）的某个字型（font）的字重常常至少4-6个，其中正常与黑体几乎是必备的：100 - 淡体 Thin ( Hairline )
android 开发中怎么用js获取手机屏幕高度
webview.addjavascriptinterface可以调用android代码android可以获得屏幕高度DisplayMetrics dm = new DisplayMetrics()getWindowManager().g
为什么html中body设置了zoom后页面上的<img>不会变大的?
&ltbody &gt&ltimg src="images6_5_002[1].png"&gt&ltform name="form1" method=&quo
html编辑器如何去掉bom字符
先来看看什么是bom头？在utf-8编码文件中BOM在文件头部，占用三个字节，用来标示该文件属于utf-8编码，现在已经有很多软件识别bom头，但是还有些不能识别bom头，比如PHP就不能识别bom头，这也是用记事本编辑utf-8编码后执行
怎样用css实现透视效果
&lt!DOCTYPE html&gt&lthtml&gt&lthead&gt&ltmeta charset="UTF-8"&gt&ltt
怎么从css文件查看网页的背景颜色?
首先，在打开浏览器，摁F12，一般在页底都会出现开发人员调试器，例如：（chrome）（firefox）把鼠标移到你想要查看的模块，单击右键，选择“审核元素”开发人员工具会自动定位到该元素，并且将对应的css显示给您，您就可以查看背景颜色了
html里面<i>和<em>标签有区别吗？
主要区别：&ltem&gt是基于内容的样式，&lti&gt一个是基于物理的样式。&lti &gt是视觉要素（presentationl elements），分别表示无意义的加粗，无意义的斜体
眼部如何化妆好看-超详细的眼部化妆步骤(图片)_眼妆教程
导语：古老的城堡中住着美艳而又高贵的贵妇，她的红唇妆让人觉得惊艳而不能忘记。但是眼妆也更不能忽视哦，不如一起来试试眼部化妆吧，完全的熟女路线哦。眼妆用品： BB黑色眼线胶 NARS 9952眼影盘 ruby &ampmillie四
Javascript注释怎么写
单行注释和多行注释。单行注释用双反斜杠“”表示。当一行代码有“”，那么，“”后面的部分将被忽略。而多行注释是用“*”和“*”括起来的一行到多行文字。程序执行到“*”处，将忽略以后的所有文字，直到出现“*”为止。&
java数组怎么声明
1. java中定义一个字符串数组方式如下，string类型和其他基本类型相似，创建数组有两种方式：String[] str={"AAA","BBB","CCC"}String
什么是C语言
C语言是贝尔实验室在20世纪70年代初开发的一种用途广泛的编程语言。 1969年Ken Thompson在PDP-7上用汇编语言编写了Unix的最初版本，用汇编语言编写的程序是难以维护的，Ken Thompson 意识到需要一种更加高级
2019最好用的自动化测试工具Top 10，果断收藏
这个时候总是无奈的说: 你应该学习Python 或是Java 你应该掌握Selenium 又或者你需要学会jmeter，嗯，可能LoadRunner你应该学习也许SoapUI是个不错的选择，或者你可是试试PostMan
请问淘宝装修市场里的CSS模版怎么做的，需要买书吗
淘宝针对网店出过一本书，要是你会基本的网页布局及CSS样式的话，建议就不要买了。另外淘宝的装修店面，有两种。一有部分权限只做做一些静态的HTML文件的，另外可以装修全部模板的，对于第二种，要了解CSS及网站布局的大部分知道。若是你不太会可以
在C语言中，“ctime”是什么意思？
没有#include的写法，只有#include，time.h是c语言里时间的库函数。ctime在c语言里，只是一个把日期和时间转换为字符串的函数。具体函数原型为：char*ctime(consttime_t*timer)用法实例：#inc
less样式如何使用cssmodule
1.Less变量：@变量名混合：在a类中使用b类的所有属性， .a{ .b()color:#fff}嵌套：使用嵌套代替原始css的层叠，&amp表示当前选择器的父级运算：+ - * ，可以对任何数字、颜色或变量进行运算转义：函数：
Vue.js2.0中子组件修改父组件传递过来的props，并不影响父组件的原始数据
vue2.0中，子组件中不能修改父组件的状态，否则在控制台中会报错。但是经我测试发现，这仅限于props为非数组及对象等引用类型数据，譬如字符串，数字等如果props是对象或数组的话，在子组件内修改props的话，父组件是不会报
JS之使用Canvas绘图
&ltcanvas&gt元素负责在页面中设定一个区域，然后就可以通过 JavaScript 动态地在这个区域中绘制图形。要使用 &ltcanvas&gt元素，必须先设置其 width 和 height
python怎么安装？
python安装需要下载对应电脑位数的软件，按提示安装之后，需要进行测试安装是否正确，具体内容如下：1、从Python官网中找到下载菜单，下载Windows环境下最新Python版本。2、双击python-3.6.4.exe安装程序，勾选
CSS定义的样式中的文字会多出来自动转行该怎么解决
css换行属性:语法：word-wrap:normal|break-word取值：normal:　默认值。允许内容顶开指定的容器边界break-word:　内容将在边界内换行。如果需要，词内换行(word-break)也将发生说明：设置或检
怎么用java实现html代码
ava要运行html代码，需要运行在服务器端，也就是servlet容器中，经过容器编译解析，返回html静态内容，示例如下：在servlet里面写就可以了引入一系列包import java.io.IOExceptionimport java
目前有没有好用的HTML5的IDE？
Notepad++包含插件Explorer（管理代码文件）和插件ZenCoding（提高编码速度）和4大浏览器MSIE9+、FF（带上Firebug）、ChromeSafari、Opera。SublimeText2，很好用的IDE；Web
div 中的字体如何用CSS控制居下
div 中的字体如何用CSS控制居下的方法：1、用margin-top 或者padding-top 设置。代码： &ltdiv class="text"&gt&ltdiv&gt.text
JS之使用Canvas绘图
&ltcanvas&gt元素负责在页面中设定一个区域，然后就可以通过 JavaScript 动态地在这个区域中绘制图形。要使用 &ltcanvas&gt元素，必须先设置其 width 和 height
如何快速学习 Ruby on Rails
这个看你英文水平和有没有html+css+js的基础咯，假设这些都没有问题，（一般来说想学rails的，这些也应该没有问题）效率最高肯定是看官网教程railsguides，(也有中文翻译)然后在rails for zombies跟着动手试一
go语言适合做什么
Go语言主要用作服务器端开发。其定位是用来开发“大型软件”的，适合于需要很多程序员一起开发，并且开发周期较长的大型软件和支持云计算的网络服务。Go语言融合了传统编译型语言的高效性和脚本语言的易用性和富于表达性，不仅提高了项目的开发速度，而
ty在音标里发什么音
tr分别是tr的发音。齿龈后部破擦辅音。发音时舌身与r相似，舌尖贴齿龈后部，气流冲破阻碍发出短促的t后立即发r。tr是清辅音。发音秘诀：1.舌身采取发r的姿势，舌尖向上贴住上齿龈后部，形成阻碍。2.舌头放开，气流从舌

推荐阅读

热门文章

最新发布

标签列表

Python里怎么用find找出HTML里需要的资料(不用re模块和beautifulSoup）

给您推荐相同类型的内容：