python实现起来可能没有现成解决方案。因为py库可能没有全面的office套件解析器。
mac想批量转,很容易。
安装openoffice。
终端执行 soffice --headless --convert-to txt my_file.doc/.docx
如果批量将当前目录下所有doc转为txt,则写过简单shell:
for i in `ls *doc`do soffice --headless --convert-to txt $i done即可。
以上同时适用linux。
用什么 w32com啊。用python的一个开源包。或者是用apache的tika(java)版本。或者是你用openoffice。用了python就和winows再见吧。因为只有linux上才是最好用的。然后就和开源结亲了。各种包,基本上应有尽有。
你的这个问题其实挺简单的。很可能是编码的问题。建议你先将txt转换成doc,再将doc转换成pdf。这样就绕过去了。问题不一定要强行解决。学着绕过去。