我有一个txt文件:
$ file -i x.txt
x.txt: text/plain; charset=unknown-8bit
$ file x.txt
x.txt: Non-ISO extended-ASCII text, with CRLF line terminators
并且有些字符编码不正确:
trwa³y, sta³y, usuwaæ
如何将该文件的编码更改为UTF-8?到目前为止,我已经尝试了以下方法:
$ iconv -f ASCII -t UTF-8 x.txt
puiconv: illegal input sequence at position 4
也许我应该以某种方式使用extended ASCII
(high ASCII
),但无法在iconv
的编码列表中找到它。
2
您可以将文件上传到某个地方吗?
—
janos 2014年
大约90%的时间中,“非ISO扩展ASCII文本”将是使用Windows 1252代码页编码的文件。“它可能是世界上最常用的8位字符编码。” (维基百科)。首先尝试:
—
nyov
iconv -f windows-1252 -t utf-8 file