1、实现富文本中样式代码的分离;
2、保留CSS样式;
其实以上两个步骤是相互矛盾的处理过程,无法通过Jacob或POI组件加正则表达式过滤解决,于是进行了以下步骤的实验:
1、首先创建了一个空白word文档,格式(office 2003格式或office 2007格式)不限;
2、将word格式保存为html格式,通过Edit Plus打开,发现代码中使用了office的命名空间,同时使用了office命名空间的标签定义了CSS样式,自己测试了一下,将生成的html文件头和尾拷贝出来:代码如下:
以上HTML头是office的命名空间定义。
3、将使用富文本代码粘贴到红色标识的<!-- 富文本代码区 -->中,并以doc或docx格式保存文件;
4、大功告成,打开文件时,Word将会以“Web版视图”完美显示了富文本样式,成功解决了富文本代码中样式代码,并同时保留了格式;
目前研究的仅能保存文字,未处理有图片的代码,朋友们可以再研究一下带图片的富文本代码的转换;
使用Word软件编辑文档时,可以设置以HTML功能显示像素,从而方便以网页形式显示文档内容。...展开
品牌型号:
联想小新Pro14
系统版本:
Win10
软件版本:
Word2019
方法/步骤分步阅读
1
/5
首先打开Word软件,进入到主编辑页面。
2
/5
接着点击左上方的“文件”选项卡。
3
/5
在左侧列表选择“更多...”项,并在弹出列表中点击“选项”。
4
/5
在“Word选项”窗口左侧,选择“高级”项。
5
/5
最后在右侧“显示”栏中,勾选“为HTML功能显示像素”复选框即可。