怎样把DOCX格式的文件转为HTML?

html-css025

怎样把DOCX格式的文件转为HTML?,第1张

想要将文件进行格式的转换,完全可以利用PDF文件转换工具,可以下载一个迅捷PDF转换器,在转换器中可以轻松将文件进行格式转换。

一、首先打开软件,在功能栏中点击文件转HTML。

二、添加文件,在操作页面中点击或拖拽文件进行添加,将DOCX文件添加进去。

三、开始文件转换的操作,点击开始转换按钮。

pip install pydocx

from pydocx import PyDocX

html = PyDocX.to_html("test.docx")

f = open("test.html", 'w', encoding="utf-8")

f.write(html)

f.close()

通过网页上传word文档,只接收docx

<form method="post" enctype="multipart/form-data">

<input type="file" name="file" accept="application/vnd.openxmlformats-officedocument.wordprocessingml.document">

</form>

windows下,将doc转为docx

pip3 install pypiwin32

from win32com import client

word = client.Dispatch("Word.Application")

doc = word.Documents.Open("D:\ \ .doc") //绝对路径 doc文件

doc.SaveAs("D:\ \ .docx",16) //保存的docx 文件,绝对路径

doc.Close()

word.Quit()