如何从Microsoft Word 2010文档中删除ASCII“Null”?


1

我已经OCR了一份文件。OCR软件在最终的Word 2010文档中创建了许多NULL字符。我知道因为我找到了这个转换器,它将一个有问题的字符串转换成了122 117 110 101 104 NULL 32 109 101 110 100)。

我有一些我想要执行的搜索和替换操作。Null阻止我这样做。

如何在此文档中找到所有NULL字符?

到目前为止在“搜索”字段中尝试过:

  • ^ NULL
  • ^ 000(ASCII)
  • ^ u0,^ u00,^ u000,^ u0000(Unicode)

我不介意解决方案是否要求我使用OpenOffice / LibreOffice或VBA。

关于NUL的更多信息:

无关的问题:


您可以将文本复制并粘贴到记事本中。如果NULL仍然存在,则在文本文档上使用tr。(例如`tr“0x000”“”用空格替换NULL)。
Hennes 2013年

@hennes我应该用什么工具替换它?如何在记事本中输入tr?
用户99572罚款

Tr是一个单独的程序(TRanslate)。它应该默认安装在OS / X上。如果你使用的是windows,你可以从unxutils.sourceforge.net下载它。 但在你尝试之前,首先从winword.exe复制它,粘贴到记事本并保存。这可能已经足够了。
Hennes 2013年

Answers:


2

我终于明白了。

NULL是ad十六进制代码(至少根据这个网站:http//www.string-functions.com/string-hex.aspx)。

ad173在unicode(根据这里:http//easycalculation.com/hex-converter.php)。

当我在Word中搜索时^u173,它就像一个魅力。


有趣的是,当我在2010
MDMoore313

@ MDMoore313很有趣,当我使用Unicode快捷键(Alt-X或Alt-C)时,我和你一样。但是当我做Alt + 0173时,我得到NUL,它在Word中显示类似于连字符。
用户99572罚款

0

尝试按住ALT键,255在数字键盘上键入,然后释放ALT键。

更新

尝试这个:

There is a symbol which looks like ...

N
U
L

... which is U+2400 (press and hold Alt while you type 9216 - or in recent 
versions of Word type 2400 and press Alt+X)

取自http://www.wordbanter.com/showthread.php?t=78318。我可以确认它对我有用,但我不知道这是否是他们所指的标志。


1
0xFF('ÿ')与0x00(NUL)完全不同。
Adam Caudill 2013年

奇怪,在Windows的其他地方它显示空白。这在旧版本中曾经是null。
MDMoore313 2013年

没工作。但我最终发现 - 发布了我自己的答案。感谢您的麻烦
用户99572在2013年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.