如何将Word文档另存为HTML以在Firefox中查看


10

我需要将Word文档另存为HTML。它具有一些背景图像,其他图像,文本,...在Internet Explorer中可以正确打开,但是如何将word doc保存为HTML,以便Firefox和其他当前的浏览器正确呈现它?

文档中缺少所有图像。我浏览了生成的html文档,但是图像的路径似乎正确。

任何的想法?

诸如“不要将文档另存为html”之类的内容在这里将无济于事。

编辑:为了清楚起见,普通的“另存为HTML”不会将其剪切,结果是在Internet Explorer以外的任何浏览器中都损坏了。

编辑2:我使用的是Word 2010和Firefox4。我也尝试在最新的Chrome版本中渲染它,但同样失败。我使用了不同的兼容性设置来另存为html,这并没有帮助


2
您能否提供一个屏幕截图(或部分屏幕截图),向我们展示失败的方式?
Majenko 2011年

我将描述的不是该特定文档,如果不够的话,我将创建一些新内容。我在整个页面上都有一个带有背景图像的word文档,在各个位置都有其他图像,并且在页面上设置了格式文本。生成的HTML是白色背景,没有图像,只有格式化的文本。
private_meta

2
将word用于html通常是一个可怕的想法。我很好奇如何将其上传到google docs并使用其html输出功能,或者使用有用的OOo / libreoffice进行导出
Journeyman Geek

无法帮助您了解Word文档本身。Google文档会显示图像,但破坏整个格式的程度甚至超过Word Export。我还没有尝试过OOo,现在还没有安装它
-private_meta

刚刚在Open Office(3.2。*)中进行了测试。在Open Office Writer中看起来还可以,但是在浏览器中查看时会中断
private_meta

Answers:


6

当使用Word另存为网页(htm html)时,在单击“保存”之前,请注意“工具”下拉至“保存”按钮的左侧。进入此下拉菜单,单击“ Web选项”。在出现的选项框中,取消选中标记为“依靠VML ...”的框,这对我很有用。祝好运。


您有哪个版本的Word?我查看了2003年,默认情况下它们似乎都没有选中“依靠VML ...”。
斯蒂芬,

4

我有一个涉及直接修改HTML代码的黑客。我正在使用MS-Office 2007和FF 10.0.4。

诀窍是删除将<v:imagedata src = ...>文件保存为HTML时Word生成的杂项,并用标准替换<img src = ...>。前者(imagedata ...)只能由IE呈现,而后者是标准的,并且可以由所有浏览器处理。

例:

删除以下内容-

<span style='mso-no-proof:yes'><v:shape id="Picture_x0020_2" o:spid="_x0000_i1026"
 type="#_x0000_t75" style='width:282.75pt;height:207.75pt;visibility:visible;
 mso-wrap-style:square'>
 <v:imagedata src="dcsl_overview_files/image006.png" o:title=""/>
</v:shape> </span>

带有:

<img src="dcsl_overview_files/image006.png" alt="overview figure">

2

我遇到了同样的问题。似乎出于某些原因,Word确实为某些文档导出了常规HTML。

通常,Word使用两种代码导出图形:一种用于在IE中呈现的特殊代码,另一种用于其他浏览器的常规HTML。

代码如下所示(为了便于阅读,我删除了很多代码)

<p ...><span ...><!--[if gte vml 1]><v:shapetype...>
 [code for IE]
</v:shapetype>
<v:shape id="Picture_x0020_2" ... alt="...png" ...>
 <v:imagedata src="...docx_files/image001.png".../>
</v:shape><![endif]-->
<![if !vml]><img width=169 height=119
src="..."... ><![endif]></span></p>

注意条件吗?

<!--[if gte vml 1]> IE Code <![endif]--> <![if !vml]> Non IE HTML <![endif]>

对于某些文档,我看到Word停止了双语并且仅导出IE部分。

对于这些情况,我还没有解决方案。仍在调查中


2

尝试另存为网页,过滤器以删除Office特定的标签。在Word 2007上,这将清理所有难看的Office标记并生成一个干净的html文件。


1

我只尝试了一个简单的文档,在Chrome中呈现,所以使用YMMV-但您是否尝试另存为Web Page, Filtered(在我的Word 2010副本中可用,并且假定所有版本都可用)。

这应该剔除了很多最糟糕的东西,但是,输出可能并不总是完美的,与浏览器无关的HTML。


0

在快速访问工具栏中,有一个称为Web页面预览的选项。我认为这应该可以工作(我有Word 2007时就进行了测试,但不知道它是否在2010年和2013年可用)。


-2

由于显然没有其他方法起作用,因此它成为了该死的“仅IE”解决方案之一。

编辑:只是为了澄清:我自己回答了这个问题,因为8个月没有收到任何其他答案了。由于我现在不再需要该解决方案,而且时间太久了,因此我将/无法接受其他解决方案。


其他人可能会遇到相同的问题,包括我自己。因此,这是一个非常有用的问题。请足够友善并标记您认为它可以解决问题的答案。我个人认为@Saurabh Bagchi是一个很好的解决方案。
Alin C
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.