1、打开sublime text 3,新建一个PY文件。
2、import os,因为涉及到系统文件路径的原因,我们这里先导入系统模块。
3、html = open("E:\\Download\\new\\new.html", "w"),创建变量,然后设置文件名字,注意用w写方式来进行,这样就会创建一个新的HTML文件。
4、html.write("<!DOCtype HTML>\
\n<head><title>新的网页</title></head>\
\n<body><h1>大家好啊</h1></body>")
这个时候就可以写入相关的HTML代码了。
5、这个时候可以双击打开HTML文件,那么就可以看到书写的网页了。
6、然后加上html.close(),记得加上这行代码来关闭,不然会占用很多内存,这样就完成了。
这让我想到了一个应用场景,在实时网络征信系统中,通过即时网络爬虫从多个信用数据源获取数据。并且将数据即时注入到信用评估系统中,形成一个集成化的数据流。
可以通过下面的代码生成一个提取器将标准的HTML DOM对象输出为结构化内容。
图片来自集搜客网络爬虫官网,侵删。