这不是老式的:我记得在80年代,我们没有现成的扫描仪,必须从大幅面打印的地图上抬起坐标和高程以进行地统计分析时,才必须解决这个问题。
实际上,您已经可以沿着地图上任何经度线准确地读取经度。您想将这些测量值插值到四个特定点(拐角)。纬度也一样。因此,该问题是在任何轮廓图上的轮廓之间进行插值的特殊情况。因此,您不需要了解任何有关投影或基准的信息。
因为这应该被简单地完成,所以我们不能轻易地利用我们拥有完整轮廓的事实。沿着每个轮廓识别几个离散点并使用它们就足够了。这使问题等同于以下内容:
给定地图上的一组点,每个点都标有(平滑变化的)数字值,以估计地图上其他指定点的值。
为了解决这个问题,我们需要为地图本身建立一个坐标系。只要坐标等值线均匀分布(它们甚至不必相互垂直!),选择就无关紧要。实现此目的的一种简单方法是使用标尺测量距左边缘(x)和地图的底边(y)。 (如果您有扫描的图像,只需使用像素的行和列索引。)
可以通过将趋势拟合到数据来完成插值。
我们知道,仅通过查看地图(即通过观察轮廓的局部规则间距),线性估计器就可以很好地工作,而二次估计器则可以更好地工作。使用任何高阶估计量可能都过大(且工作量太大)。二次估计器至少需要六个控制点。 使用聚集在估计点附近的点的集合:这将确保高精度。使用的数量要多于最小值:这将提供有用的交叉检查,甚至可以得出错误估计值。
这导致针对纬度执行以下过程,并对每个拐角点重复此过程,然后对经度再次重复遍历:
人们计算最小二乘拟合的时间远远超过了可用的机械计算器。如果您确实没有计算机或计算器,请适应线性趋势,并为(简单的)计算方法咨询任何有关1970年之前出版的回归的教科书。否则,您可以使用图形计算器,电子表格,或(最好,最简单)任何功能全面的统计数据包。后者将为您提供一个预测间隔,以评估估计中的不确定性。
例如,我两次应用此过程以使用标记的点(红色代表经度,蓝色代表纬度,黄色代表拐角)在左上角找到(纬度,经度):
使用明显的变量名,我用两个Stata 11命令为每次计算获得了预测值:
regress lat x y c.x#c.y c.x#c.x c.y#c.y if lat!=0
predict lathat
regress lon x y c.x#c.y c.x#c.x c.y#c.y if lon!=0
predict lonhat
拐角点的估计值(纬度,经度)为(61.05,-136.80)。估计的误差令人惊讶地大(约0.04度),大约是我从屏幕图像的分辨率中所期望的两倍。这些轮廓线可能不会非常准确地放置。