如何解析mht文件为html文件

html-css013

如何解析mht文件为html文件,第1张

1:本质上,这两者,没有什么区别,都是一种直观的网页浏览的格式.

2:简单理解的话,他们的区别在于保存上,mht可以直接保存所有所见,html的话则不能保存全部,服务器端文件不能保存到本地,需要依赖网络,

3:详细解释如下:

a:MHT,全称为mono html,即web单一文件,就是网页中包含的图片,CSS文件以及html文件全部放到一个MHT文件里面,浏览器在save as另存时,将页面中所有可以收集的元素全部存放在一个页面里,单个文件的尺寸就变大了,而依赖网络的文件则全部保存在本地,变绝对路径为相对路径.可以直观理解为一个网站的压缩包合集,优点在于,即便没联网也能打开显示网页.

b:HTML,全称HyperTextMark-upLanguage,即超文本标记语言或超文本链接标示语言,是目前网络上应用最为广泛的语言,也是构成网页文档的主要语言。设计HTML语言的目的是为了能把存放在一台电脑中的文本或图形与另一台电脑中的文本或图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑上还是在网络的其它电脑上。我们只需使用鼠标在某一文档中点取一个图标,Internet就会马上转到与此图标相关的内容上去,而这些信息可能存放在网络的另一台电脑中。 HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等。HTML的结构包括头部(Head)、主体(Body)两大部分,其中头部描述浏览器所需的信息,而主体则包含所要说明的具体内容。

用webBrowser打开mht文件

然后利用属性DocumentText获取源代码。。。

保存为html文件就行了。。

但效果不太理想。得视你的MHT文件而定。。有些能完美,有些不行。

webBrowser1.Url=new Uri("mht文件路径")

File.WriteAllText("保存的文件名",webBrowser1.DocumentText)

解决办法:

mht文件打开慢的原因就是一个页面包括了除文字外,还包括图片,并且所有图片信息都通过base64编码保存在这一单独的文件中,所以打开 极慢。

解决方法就是将.mht文件转换为.html文件,将图片与文本分离,再用浏览器(IE,Firefox或Chrome)打开,速度将有极大提升。

下面的问题就是如何将.mht转换为.html文件,这里将用到一个工具叫mht2html,打开软件如下图:

点“添加文件”,然后点“开始转换”,看文件大小,软件会停止响应一段时间,耐心等候一段时间,会在同目录下生成.html文件以及其中包含的图片文件夹,用浏览器打开.html文件即可查阅聊天内容。