3
处理以BOM表(FF FE)开头的文件
我收到了带有FF FEBOM 的.csv文件: $ head -n1 dotan.csv | hd 00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.| 当使用awk它解析时,我得到了一堆空字节,我怀疑这是由于字节顺序所致。如何交换该文件上的字节顺序(使用CLI),以便普通工具可以使用它? 请注意,我认为该文件仅是ASCII字符(BOM除外),但是我不能确认grep它是二进制文件: $ grep -P '^[\x00-\x7f]' dotan.csv Binary file dotan.csv matches 在VIM中搜索相同的字符串会显示每个匹配的字符! 使用iconv转换为ASCII不会摆脱\ x00值,实际上,这使问题变得更糟,因为它们现在看起来像空字节而不是UTF-8! $ iconv -f UTF-8 -t ASCII dotan.csv > …