1
如何基于RMSE计算精度度量?我的大型数据集是否呈正态分布?
我有几千个点的数据集。每个数据集中的值是X,Y,Z,表示空间中的坐标。Z值表示坐标对(x,y)处的高程差。 通常在我的GIS领域,通过将地面真点减去一个测量点(LiDAR数据点)在RMSE中引用高程误差。通常至少使用20个地面检查点。使用此RMSE值,根据NDEP(国家数字高程指南)和FEMA指南,可以计算出准确度:准确度= 1.96 * RMSE。 该精度表示为:“基本垂直精度是可以对数据集之间的垂直精度进行公平评估和比较的值。基本精度是在95%置信水平下计算的,是垂直RMSE的函数。” 我了解正态分布曲线下的面积的95%位于1.96 * std.deviation之内,但这与RMSE不相关。 通常,我会问这样一个问题:使用从2个数据集计算出的RMSE,我如何将RMSE与某种精度相关(即我的数据点的95%在+/- X cm内)?另外,如何使用适用于如此大数据集的测试确定我的数据集是否正态分布?什么是正态分布的“足够好”?所有测试的p <0.05还是应该与正态分布的形状匹配? 我在以下论文中找到了关于此主题的一些很好的信息: http://paulzandbergen.com/PUBLICATIONS_files/Zandbergen_TGIS_2008.pdf