有没有一种方法可以确定用于给定shapefile的字符集?
有没有一种方法可以确定用于给定shapefile的字符集?
Answers:
反复试验。尝试使用Ms Excel或OpenOffice使用其他设置打开.dbf文件,直到一切正确。
请查看此帖子以获取更多线索:https : //stackoverflow.com/questions/319095/how-do-i-determine-the-character-set-of-a-string
程序可以通过两种方法来确定shapefile的字符集。
该file
实用程序能够猜测文本文件的编码。使用ogr2ogr
该保留原始编码转换,如果没有.cpg
文件:
ogr2ogr -f CSV file.csv file.dbf
file file.csv
输出示例:
file.csv: ISO-8859 text
我已经使用两种最常见的编码UTF-8和latin1对它进行了测试。在Ubuntu中可以直接使用,不确定OSX。我不知道file
Windows 上的实用程序。
注意:只要有一个.cpg
指示编码的相应文件,ogr2ogr
就会接受该编码,并且输出将以UTF-8 格式显示。但是,如果CSV输出看起来正确,则说明.cpg
文件中的信息是准确的。
另一个将* .dbf的第29个字节转换为代码页的表:http : //webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm