元数据-使用python自动构建


11

我们有一个大型的(10,000多个)空间数据存储库(shp / gdb / tab向量和ecw / tif栅格,以及las,xyz和DEM数据),其中一些使用ANZLIC元数据编辑器在xml中有元数据记录。我想检查每个空间数据集是否具有关联的xml记录,并对照关联的空间文件检查投影,空间范围,源和大小。

我创建了一个基于arcpy的脚本,以从ESRI可读格式中提取此信息,但是不确定如何处理选项卡文件,更重要的是如何根据基于Anzlic Metaeditor的xml记录对其进行检查。

因此,如果我们有citypoints.shp / .tab,则应该将citypoints_metadata.shp / .tab.xml作为元数据记录-这与某些软件自动创建的citypoints.shp.xml是分开的。

另一个类似的论坛问题是使用ArcGIS 10.x的新方法是否支持ANZLIC元数据?但这并不能满足我的疑问(如何在ArcPy中读取MapInfo .tab文件),该要求不要求检查开放源代码/创意公共空间中是否存在有效记录并处理.tab(其他非esri)格式。)。我还浏览了“ 寻找开源ISO元数据编辑器”中提到的软件但它们都不自动生成基本元数据文件,也不允许将现有记录与源进行比较。


如果有人感兴趣,我现在有一个基于qgis python的解决方案。如果有人要求,很高兴分享。
GeorgeC

Answers:


2

看一下NME项目

有了它,您可以使用python脚本gdalogr_catalogue.py和以下命令,在XML中引用GDAL支持的所有元数据(也是SQL输出选项)。

python gdalogr_catalogue.py -d /home/my_directory

之后,由您决定是否可以修改从该实用程序中检索到的XML,以便将其与Anzlic元数据编辑器进行比较,或者自定义原始脚本以准确检索您所需的内容。


1

您是否考虑过将非ESRI格式转换为ESRI格式?我在想,如果脚本运行良好,为什么不使用Gdaltranslate转换栅格数据集,而用ogr2​​ogr将矢量数据集转换为ESRI格式。好的,如果您不想创建新的数据集,可以看看gdalinfo.exe和ogrinfo.exe,就像名称表明它们都产生元数据一样,这可能对您有所帮助。


不想创建其他数据-我们要处理超过1万个标签文件。
GeorgeC 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.