怎么读取html文件的内容

html-css08

怎么读取html文件的内容,第1张

读取html文件的内容方法如下:

1、找到.HTML文件的位置;

2、然后右击打开选择浏览器,就可以直接打开网页读取其中的内容。

python提取html内容的方法。如下参考:

1.首先,打开Python来定义字符串,在定义的字符串后面加上中括号,然后在要提取的字符位置输入zhidao。

2.点击运行程序,可以看到系统打印出的第一个字符在我们定义的字符串中,因为字符串是空格,空格占据了位置。

3.这里可以看到字符显示在程序运行界面的底部,根据我们指定的内容输出,这里写的版本是0输出的第一个字符。

4.还可以一次打印多个字符。如图所示,用冒号分隔字符串的开头,并将其写入方括号中以显示多个字符。

5.这里的输入位置是0到5,你可以发现,与我们的字符串内容相比,字符的相应位置被打印出来,而字符的另一个位置则完全不显示。

6.如果字符串比较大,大于内容的权重,从下面的数字比较方便,也可以直接输出倒数的字符。

7.这时直接用负号来表示这是倒数的位置,它使用起来也特别方便。

如果有一段html文本,我们想提取里面的某个属性值,但又不想写正则表达式,怎么办呢?

如果是node,因为没有dom,我们可以选择用cheerio这个库来帮我们搞定;而前端的话,我们可以新创建一个dom节点,将html文本信息以innerHTML的方式写入进去,然后就可以利用querySelectorAll等方法提取相关信息了。