好的,所以我想这种非正式的查询/调查是关于您在ESRI世界中使用的数据集的大小...
我正在建立和维护一个州范围的数据集,在这里我必须处理到各个房屋级别,而不是包裹级别,但对于我们的系统,每个包裹有多个邮寄地址。在许多地方,我使用的理论地址是根据街道网络或USPS AMS / AIS数据计算得出的。因此,我的地址列表大约有1,350万个地址,并且每月或每季度增长。
现在有没有人维护一个实时的地址/正确查找信息系统,该系统在连续数据集中如此之大?
我很想合作或谈论其他人如何处理如此大的数据集。我在尝试执行诸如相交或空间连接之类的任务时,看到ESRI软件似乎被炸毁的问题。ESRI说他们看不到这类问题,但是从9.3.1开始我就遇到了这些问题,所以我不能成为第一个/唯一这样做的人,因为我可以在多台机器上重新创建它。
我的平台现在是桌面上的ESRI ArcGIS 10,使用GEOMETRY空间对象与SQL2008后端上的ArcSDE 9.3.1-sp1进行通信。因此,我没有做任何真正具有异国情调的事情;但在我看来,在某些领域我可能仍在努力。
[进一步]
我感兴趣的是,其他人正在做什么以优化那里的处理这些数据集的流程。我将每月增加一百万条记录,并且当您开始运行其他进程并将数据链接以进行进一步分析时,地理编码等并不是问题,您开始处理复杂的联接。好了,您使用Only_FID从“相交” /“覆盖” /“标识”输出数据,并且您也得到了一个瘦的中间表来联接;但是,当您开始尝试对表的创建进行划分和征服时,您会遇到一些问题,需要将源数据划分为工作区,但是又重复了IDS,无法合并回去。因此,您剩下的是较小的数据块,这些数据块您很难轻易地重新进行完整处理。
考虑将数据分解为县级尺度的选项,然后使用空间视图将其重新组合在一起,等等。。。很好奇是否其他用户正在以如此大的规模看同样大小的问题脚印。