每当我用默认设置打开由LibreOffice保存的ODT文件,并在纯文本编辑器中打开它时,我都会感到无聊。我输入的文字没有一丝痕迹。
ODT使用哪种字符编码?
每当我用默认设置打开由LibreOffice保存的ODT文件,并在纯文本编辑器中打开它时,我都会感到无聊。我输入的文字没有一丝痕迹。
ODT使用哪种字符编码?
Answers:
ODT文件是包含几个文件的压缩归档文件(zip文件)。如果将其解压缩(解压缩),则会找到其中的内容。
$ unzip foo.odt
Archive: foo.odt
extracting: mimetype
inflating: Pictures/2000006A00000BF2000000FE05FAFF99.svm
inflating: Pictures/200000B200000BFC000002A0046833A0.svm
inflating: Pictures/200000EA00000F69000002A0332EA603.svm
inflating: Pictures/2000006200000AA500000136B263D3BB.svm
inflating: Pictures/2000006A00000AD2000001917B356A9B.svm
inflating: Pictures/2000005A00000A5A0000017F19B0D1EE.svm
inflating: Pictures/2000009200001036000001309FA6D695.svm
inflating: Pictures/2000008E00001C330000034F3E642D92.svm
inflating: Pictures/20000092000011AD0000014269F7C132.svm
inflating: Pictures/200000890000107E000002A0D7E80C67.svm
inflating: Pictures/200000E200001295000002A0E7D552DC.svm
inflating: Pictures/200000B2000012AB000001712E0D7F4B.svm
inflating: Pictures/200000CF00001D390000034F15D09B76.svm
inflating: Pictures/2000013A000019BA0000042370CD253A.svm
inflating: Pictures/2000007A00000C6300000136B0155364.svm
inflating: meta.xml
inflating: settings.xml
inflating: content.xml
extracting: Thumbnails/thumbnail.png
inflating: layout-cache
inflating: manifest.rdf
creating: Configurations2/images/Bitmaps/
creating: Configurations2/popupmenu/
creating: Configurations2/toolpanel/
creating: Configurations2/statusbar/
creating: Configurations2/progressbar/
creating: Configurations2/toolbar/
creating: Configurations2/floater/
creating: Configurations2/menubar/
inflating: Configurations2/accelerator/current.xml
inflating: styles.xml
inflating: META-INF/manifest.xml
因此,当您尝试在文本编辑器中打开它时,它会显示为二进制数据,因为它不包含编码文本!
content.xml
其中将包含文档的实际文本的文档。我希望可以使用一种UTF编码(很可能是UTF-8)进行编码。当然,它还会抛出很多其他事情,但是即使您只是天真地剥离XML,也应该非常接近。