php 读取（解析）html文档，并将读取到的文档转为数组（数组保留html嵌套格式）

2023-03-02 09:22:01html-css030

php 读取（解析）html文档，并将读取到的文档转为数组（数组保留html嵌套格式）,第1张

可以使用正则表达式来解决这个问题

具体的代码很多不详细写了，举个例子给题主吧

<?php

$htmlStr = '<li>首页</li>'

preg_match_all('/<li>.*?<\/li>/', $htmlStr , $res)

$ret = preg_replace('/(<li>|<\/li>)/', '', $res[0][0])

//输出res

//var_dump($res)

echo $ret

最终输出的结果为：首页

在这个例子上题主所需要的值基本都可以用正则算法过滤出来

希望能帮到题主

如果可以，还请采纳

1.strip_tags() 函数：可以过滤掉HTML和PHP标签，返回一个全新的字符串!

用法：

string strip_tags ( string 要处理的字符串 [, string 想保留的标签] )

比如：标签，就这样写，strip_tags($str, “”) ，如果要保留多个标签，则标签之间用空格隔开。

2.用 strpos , substr 混合处理

当我们要截取的字符串，有唯一的标识时，通常可以用这个办法，比如取一个带唯一id的标签abc,只要找到和,中间的内容就都出来了。

3.PHP DOMDocument

DOMDocument 提供的方法是输出没有任何标签的纯文本，如果你只需要文本数据，那用这个方法最简单拉

利用php解析html没有现成的方法，需要利用第三方插件PHP Simple HTML DOM Parser，它可以以类似jQuery的方式通过css选择器来返回指定的DOM元素，功能十分强大。

1、首先要在程序的开始引入simple_html_dom.php这个文件

参考代码：include_once('simple_html_dom.php')

2、PHP Simple HTML DOM Parser提供了3种方式来创建DOM对象

参考代码如下：

// Create a DOM object from a string

$html = str_get_html('<html><body>Hello!</body></html>')

// Create a DOM object from a URL

$html = file_get_html('http://www.google.com/')

// Create a DOM object from a HTML file

$html = file_get_html('test.htm')

得到DOM对象后就可以进行各种操作了

// Find all anchors, returns a array of element objects

$ret = $html->find('a')

// Find (N)th anchor, returns element object or null if not found (zero based)

$ret = $html->find('a', 0)

// Find lastest anchor, returns element object or null if not found (zero based)

$ret = $html->find('a', -1)

// Find all <div>with the id attribute

$ret = $html->find('div[id]')

// Find all <div>which attribute id=foo

$ret = $html->find('div[id=foo]')

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：电脑开不了机无限重启，怎么回事？

# 下一篇：电脑上的网络设置在哪

给您推荐相同类型的内容：

电脑插上硬盘为什么显示不出来？
一、开机之后系统没有找到或者是不能识别出硬盘这类情况的出现导致系统无法有硬盘启动，即使通过其它的手段启动电脑之后也无法找到硬盘。对于这样的情况其实解决的方法还是很简单的，这类问题出现有很大的可能性是在硬盘和主板之间的连线上面，所以在这里建
电脑怎么连接蓝牙
Windows 系统和 Mac 系统连接蓝牙的方法如下：一、工具／原料：华硕天选 2、MacBook Pro、Windows 10、Mac OS 12.0、任意型号的蓝牙耳机。二、具体步骤：（一）Windows 系统：1、点击设置
笔记本键盘膜好吗
我们在使用笔记本电脑的时候，很多人都喜欢为自己的键盘贴键盘膜。那么笔记本键盘膜好吗?以下是我收集整理的笔记本键盘膜好吗，欢迎阅读，希望大家能够喜欢。1、普通键盘贴膜都是硅胶透明键盘膜，贴膜凹凸有致具有透明、防水尘功能。但有人说键盘膜也
怎么用纯css实现点击出现下拉框，抽屉效果那种
* CSS部分 *ul { list-style:none margin:0 padding:0 text-align:center background:#F03 color:#FFF -webkit-transform:scaleY
电脑写字板在哪
以WINDOWS系统电脑为例，写字板在程序的附件里面。下面介绍具体查找方法供参考：1、打开WINDOWS系统的电脑，然后点击左下角的开始，弹出功能表后，把鼠标移到程序上。2、把鼠标移到程序上后，会弹出一个列表，把鼠标移到列表中的附件，如图
CSS outline 属性
CSS outline（轮廓）是一个简写属性，用于围绕元素外部绘制一条线。它与a:focus选择器结合使用特别有用，可以更加强调链接或其他元素。outline与border相似，不同之处在于outli
打印机怎么连接电脑？
电脑在使用过程中可以连接打印机，下面是带来的连接方法，希望可以帮到大家。1、首先打开电脑的【开始菜单】，点击右侧的【设置】。2、然后在弹出的设置对话框里面，选择【设备】。3、然后在打开的设备页面中，点击下方的【设备和打印机】。4、接下来点
js 复制文字功能
功能：点击按钮，复制值。实现方法：通过原生js 的方法 document.execCommand('copy')巨坑：document.execCommand(‘copy’)不生效原因：
电脑找不到硬盘怎么解决
首先用螺丝刀打开电脑机箱，然后重新拔插电脑硬盘数据线和电源线。打开BlOS,查看standardomosfeaures页面，检查是否把硬盘设置为无，将此项设置为auto。接着找到ATA（SATA)选项选择进入。如果电脑使用的是SATA硬盘，
电脑声音怎么调节
使用电脑时想调声音，该怎么操作呢？下面小编就来告诉大家电脑如何调声音的操作方法：鼠标右击电脑桌面，点击最下方“个性化”。在个性化界面点击“主页”，找到并点击“系统”选项卡下的“声音”。在声音界面找到音量调节条，拖动选择合适的音量即可。另外可
电脑开机了屏幕不显示为什么
电脑开机显示器不显示的原因有：1、电路不通，或者是电源接口或电源线接触不良或损坏；2、一般是内存条松动或氧化而接触不良，或显示器数据线接触不良，或内存、显卡、显示器或数据线损坏。解决办法是：打开电脑后盖，找到内存条，拔下在重新插下，这种原因
长虹F80平板电脑怎么双清
长虹F80平板电脑双清方法：1同时按电源建和音量+键进入RECOVERYMode2按音量键，选择wipedatafactoryreset后，按电源进入确认界面3按音量键，选择Yes--deletealluserdata，完成后选择rebo
html页面怎么实现动态加载页面
方法：1、直接贴图：在界面上贴一个gif动态等待效果图片，gif图片获取方式：网上找素材，会ps的可以自己制作&ltimg src="wait.gif" &gt2、CSS3SVGHTML5 Canv
横向排列html代码
代码如下：&lttable &gt&lttr&gt&lttd width="400" &gt&ltul style="list-style-type:no
如何让电脑直接进入睡眠状态
在桌面设置快捷方式。很多时候，用户需要离开电脑，但是又不想关机，这种情况下，让电脑进入睡眠（待机）状态是一个最好的选择，既省去了关机开机的麻烦步骤，又能节约用电，保护电脑。下面是让电脑直接进入睡眠的操作:1.右击桌面，选择“新建”，点击“快
如何将html转换成xml，跪求请说明具体算法和用到的工具
我给你些我的建议吧HTML的语法格式比XML宽松多了，真正XML格式的网页是XHTML，也就是下一代HTML，他的格式和XML差不多，很严谨的。如果你不想利用某些HTML和XML互转工具，自己编的话，有一定难度。1.HTML的节点可以没末节
怎样在电脑上下载红警
在网站搜索红色警戒，根据搜索结果，选择下载地址在列表里选择自己下载的版本，目前网络大量的下载资源是红警2和红警3例如，选择下载红警2版本，点击本地下载，下载之后使用压缩包解压，解压之后打开文件夹点击安装，根据安装提示安装游戏即可红色警戒电脑
aoc是什么牌子的电脑
品牌型号：AOC AIO大师926一体机系统：Windows 10aoc是冠捷科技品牌的电脑。aoc品牌在全球三十多年的行销过程中，由于其良好的品质、丰富的售后服务经验与基础及高素质的研究开发能力，使其在国际市场上极具竞争力
什么是DOS？
分类:电脑网络 &gt&gt操作系统系统故障问题描述:DOS具体有什么用途呢？什么情况下才用到这个工具？解析:什么是DOS一、什么是DOS?(一)DOS是什么?有什么用?我们使
如何在电脑上安装微信步骤
品牌型号：联想GeekPro 系统：win10 1909 64位企业版软件版本：360安全浏览器13.1,微信3.6.5 如何在电脑上安装微信步骤呢?下面跟大家分享一下微信电脑版如何安装。 1、打开电脑上浏览器，输入搜索网
优酷电脑版叫什么名字
2012年7月18日，国内第一视频网站优酷(NYSE:YOKU)宣布其“iku客户端”正式更名为“优酷PC客户端”。新界面优化人机交互，七大功能满足视频用户需求。用户登录时可以先下载体验。优酷客户端相关负责人表示，优酷多终端产品为各类不同需
ie浏览器每次访问网站时都要从服务器下载js文件吗
ie浏览器每次访问网站时都要从服务器下载js文件。根据查询相关资料信息，访问这些网页的时候，js脚本就被浏览器解析执行了，在浏览器解析执行js脚本的时候就会加载你引用的js文件，一般一个网页不要用太多复杂的js脚本，因为js脚本与php，a
《响应式Web设计HTML5和CSS3实战》epub下载在线阅读，求百度网盘云资源
《响应式Web设计》（Ben Frain）电子书网盘下载免费在线阅读链接：https:pan.baidu.coms1uGNLfG4jnUMWF7-iwuiW3w密码：xai0书名：响应式Web设计作者：Ben Frain译者：
电脑怎么恢复出厂设置
计算机内置的 F10 系统恢复出厂设置功能，能短时间内帮您将计算机系统恢复到初始状态。一、F10 恢复出厂设置操作前须知：1.系统恢复出厂会删除 C 盘中数据（包含桌面文件、下载、文档等）和安装在 C 盘的软件，您可以勾选备份 C 盘个人文
前端书籍推荐
对于零基础小白，可以看看以下书籍《图解 HTTP》：一本HTTP的神书，图文并茂，生动形象，非常适合小白学习。《Head First HTML与CSS(第2版)》：入门真的是经典书籍，手把手教学，丰富的案例让你从 0 开始学前端。《锋利的j
jquery.tools.min.js冲突怎么解决
将jQuery 库在Base 库之前引入，那么“$”的所有权就归Base 库所有，而jQuery 可以直接用jQuery 对象调用，或者创建一个“$$”符给jQuery 使用。var $$ = jQuery创建一个$$的jQuery 对
联想主机如何拆图解
联想台式电脑主机的主螺丝在主机两侧，拆卸步骤如下：首先拔掉主机后面所有的线路，然后拧开两个大螺丝，打开机箱后盖拆内存，用力搬开内存条两头的卡锁，往上使劲拔出内存条拆硬盘，拔掉硬盘的两个线头，拧开固定硬盘的螺丝即可拆显卡，拔掉右下角的
用css给不定高的＜div class=“tips”＞＜div＞垂直居中，请写出三种方法。
1.定位top50%margin-top：-50% 2.给父级设置高和行高相等，3.用一个“ghost”伪元素（看不见的伪元素）和 inline-blockvertical-align 可以搞定居中，非常巧妙。但是这个方法要求
js如何判断用户行为动态添加input属性？
&ltinput type="text"&gt&ltscript&gtdocument.querySelector('input[type="text"]&#
电脑打印文件打印不了
电脑打印文件打印不了是打印错误造成的，解决方法为：1、需要来确认电脑的系统的是64位还是32位可以对准我的电脑右键属性查看。2、需要安装对应电脑数位的打印机的驱动如图所示哦，同时还需要通过USB将打印机和电脑连接。3、需要将PDF的文件放

推荐阅读

热门文章

最新发布

标签列表

php 读取（解析）html文档，并将读取到的文档转为数组（数组保留html嵌套格式）

给您推荐相同类型的内容：