将Microsoft Word文档(.doc / x)转换为HTML文件


8

有谁知道一个好的应用程序可以快速有效地完成它?

我买了Word Cleaner,但结果仅仅是足够的,我需要遍历所有生成的html文件来清理大量无用的注入标签,例如

<strong>H</strong><strong>ell</strong><strong>o </strong><em>Wor</em><em>ld</em>

我管理的网站上显示的大多数文章都是基于人们在MS Word上编写的文档,人们对这些页的边距或有序/无序列表,脚注/尾注等几乎一无所知,而我不能让他们使用其他东西。

有没有人比我翻阅更正和应用我的CSS风格的技巧来帮助我更有效地处理这些页面?

注意:仅作记录,在Word中使用“另存为HTML DOC”比使用Word Cleaner最糟糕

Answers:



3

我认为最好的解决方案是使用WYSIWYG编辑器。以TinyMCE为例,它是一个很好的工具-尽管我怀疑您可能需要一个独立的工具。用法将类似于任何类似单词的程序,但输出将是纯HTML。另外,您是否尝试过其他类似单词的程序,例如OpenOffice或LibreOffice?HTML并不是很好,因为它具有很多内联样式,但是从快速测试来看,它似乎没有很多不必要的标签的问题。


tinyMCE很棒,这也是我试图使用它们的原因。我已经添加了更多的格式设置选项来帮助他们获得他们想要实现的目标,但这是从单词到我正在努力实现的其他目标的迁移,同时我一直在接收.doc文件。但是无论如何,谢谢,您说openOffice在将doc转换为HTML方面提供了良好的效果,我会尝试一下。
danie7LT 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.