保存为网页 - 列表不会全部使用UL或OL html标记保存


1

我正在获取由其他人创建的文档,其中包含以下列表:

  • 清单项目1
  • 清单项目2

我需要将它们转换为HTML,我在Word中使用另存为网页。存在一些问题,即某些列表转换为<ul><li>标记但有些列表已转换为

· List Item 1 
· List Item 2 

有这个·奇怪的点字符,没有<ul>标签。

<p class=MsoListParagraphCxSpMiddle style='text-indent:-18.0pt'><span
style='font-family:Symbol'>·<span style='font:7.0pt "Times New Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span></span><span style='font-family:"Times New Roman","serif"'>56464</span></p>

链接到生成此行为的示例文档

我能看到的两个列表之间唯一相关的区别是第二个(有问题的)列表在功能区栏的样式对话框中设置另一个样式

第一个有Normal风格,第二个有Paragraph with a list风格。我无法在Word 2013中创建具有Normal样式的列表- 不知道,它是如何创建的。

有一个技巧如何解决这种行为?

Answers:


2

看起来你在doc中有不同的格式样式。

<w:p w:rsidR="00BD738A" w:rsidRPr="00BD738A" w:rsidRDefault="00BD738A" w:rsidP="00CE27F3">
    <w:pPr>
        <w:numPr>
            <w:ilvl w:val="0"/>
            <w:numId w:val="1"/>
        </w:numPr>
        <w:jc w:val="both"/>
        <w:rPr>
            <w:rFonts w:ascii="Times New Roman" w:hAnsi="Times New Roman"/>
        </w:rPr>
    </w:pPr>
    <w:proofErr w:type="spellStart"/>
    <w:r>
        <w:rPr>
            <w:rFonts w:ascii="Times New Roman" w:hAnsi="Times New Roman"/>
            <w:szCs w:val="20"/>
        </w:rPr>
        <w:t>ssssss</w:t>
    </w:r>
    <w:proofErr w:type="spellEnd"/>
</w:p>

=========

<w:p w:rsidR="00BD738A" w:rsidRDefault="00BD738A" w:rsidP="00BD738A">
    <w:pPr>
        <w:pStyle w:val="Odstavecseseznamem"/>
        <w:numPr>
            <w:ilvl w:val="0"/>
            <w:numId w:val="3"/>
        </w:numPr>
        <w:jc w:val="both"/>
        <w:rPr>
            <w:rFonts w:ascii="Times New Roman" w:hAnsi="Times New Roman"/>
        </w:rPr>
    </w:pPr>
    <w:proofErr w:type="spellStart"/>
    <w:r>
        <w:rPr>
            <w:rFonts w:ascii="Times New Roman" w:hAnsi="Times New Roman"/>
        </w:rPr>
        <w:t>rrrrr</w:t>
    </w:r>
    <w:proofErr w:type="spellEnd"/>
</w:p>

您可以看到这两个XML块之间的区别。

我做的是,将文档扩展名.docx更改为.zip并将其解压缩。

在提取的文件夹旁边有一个名为word的文件夹。

有一个名为document.xml的XML文件包含您的文档正文内容。

解决方案: 我选择了word文档的第一部分。

XXX:  
•   Aaaa
•   ssssss
•   xxxxxxx

并使用格式画家工具格式化sescond部分。

Nabízíme: 
•   rrrrr
•   asas klůsddlůask asdkllůasdklůasdklů asdlkasdlůkasdlůkadlůk asdlkasdlůasdklůasdklů  asdlkasdlůkasdlůkasdlůkasdk
•   asasasas
•   5 45464564
•   56464
•   87989789

然后将其另存为HTML。问题解决了。

如果方便的话你可以试试这个。


谢谢,我已经看到了xml的差异,但是编辑使docx无法打开。格式画家的诀窍效果很好,我仍然很好奇背后的东西,所以在接受之前要等一会儿。
VojtěchDohnal2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.