想要将文件进行格式的转换,完全可以利用PDF文件转换工具,可以下载一个迅捷PDF转换器,在转换器中可以轻松将文件进行格式转换。
一、首先打开软件,在功能栏中点击文件转HTML。
二、添加文件,在操作页面中点击或拖拽文件进行添加,将DOCX文件添加进去。
三、开始文件转换的操作,点击开始转换按钮。
pip install pydocx
from pydocx import PyDocX
html = PyDocX.to_html("test.docx")
f = open("test.html", 'w', encoding="utf-8")
f.write(html)
f.close()
通过网页上传word文档,只接收docx
<form method="post" enctype="multipart/form-data">
<input type="file" name="file" accept="application/vnd.openxmlformats-officedocument.wordprocessingml.document">
</form>
windows下,将doc转为docx
pip3 install pypiwin32
from win32com import client
word = client.Dispatch("Word.Application")
doc = word.Documents.Open("D:\ \ .doc") //绝对路径 doc文件
doc.SaveAs("D:\ \ .docx",16) //保存的docx 文件,绝对路径
doc.Close()
word.Quit()