在ArcGIS中如何计算地理编码分数?


11

对地址表进行地理编码后,ArGIS将提供有关每个地理编码地址的信息,其中包括与该地址匹配的候选人的“匹配分数”,范围从0到100。根据他们的文档,“匹配分数基于在参考数据中找到的位置与正在搜索的地址数据的匹配程度如何。”

看起来很直观,即100表示​​在地址定位器中找到了具有确切名称的地址,而0表示未找到这样的地址。但是,我找不到有关此分数的精确计算方式的任何信息,尤其是当值介于两个极端之间时。我知道吗?

我在此问题的答案中找到了指向该白皮书的指针,但是在该白皮书中找不到任何可以回答该问题的信息。

Answers:


10

分数基于加权编号系统;根据每个优先级/配置的地址元素区域中匹配字符的数量。因此,可以匹配的字符越多,获得高分的可能性就越大。

当使用范围地址数据(例如街道中心线)时,地址范围和奇偶校验也将纳入该过程。因此,如果您的偶数范围是3000-6000,地址是2998,但街道名称的其余部分匹配;ArcGIS会将其作为候选人,但会降低分数,因为该数字超出了预期目标。

  • 德怀特

请参阅有关Re:地理编码得分文档的 Bruce Harold的回复:如何确定得分值?

“回复:地址解析得分文档:得分值是如何确定的?Bruce Harold级别5 Bruce Harold员工2015年10月10日,下午2:25(响应Nathan Lowry)

你好

分数计算没有详细记录,但是我可以给您一个缩略图。

如果从Firefox的安装位置在文件:/// C:/ Program Files(x86)/ArcGIS/Desktop10./Locators中打开USAddress.lot.xml,您将看到可导航的树。

在顶级元素中,导航到FullNormalAddress;NormalAddress(70)和Zone(30)的上标数字是这些元素的得分贡献的相对权重。巧合的是,它们总计为100,但只有相对权重才有意义。

从NormalAddress进一步导航,您将看到House和FullStreetName分别将分数的70/100分别贡献为15/75和60/75,其中75是权重的总和,再往下可以看到元素前缀(5/92 ),预类型(6/92),StName(70/92),suftype(6/92)和后缀(5/92)权重,其中92是这些权重的总和。如果需要预期的拼写校正来匹配参考数据,则可以由XML文件的“拼写/评分”部分确定任何最低级别元素的单个分数(例如如何从不完善的街道名称中计算出分数贡献)。专有的算法,用于处理意外的拼写错误,杂音或重复的字符,例如键盘弹跳时。

分数是从下至上的权重总和,以百分比归一化。缺少元素不会惩罚分数,它们根本不会做出贡献。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.