我有一个很大的文件,整个文件零散。使用打开和编辑它花费的时间太长,vi
因此我想使用删除该字符的所有实例sed
。问题是,我不知道如何匹配角色!我已经尝试使用\u200B
,\x{200b}
。有任何想法吗?
如果有帮助,我正在运行CentOS 5。
您的sed副本是否支持文件编码所使用的Unicode编码?如果不是,可能没有很好的方法来正确地使用sed,而您最好使用python脚本之类的东西……
—
JanC
@JanC-确实,我已经使用了Python。该文件使用utf8编码,似乎足够标准,以至于任何东西都可以对其进行处理。我在下面添加了我的python脚本,以防它对任何人有用。
—
thetaiko