地理加权回归分析中的空值


12

我的一些解释变量对某些多边形有一些空值。

可以通过地理加权回归分析来处理这些问题,还是应该删除整个多边形和所有数据(该特定多边形的因变量和自变量)?


这些空值代表什么?值不适用或确实存在但未知吗?如果是后者,为什么未知?(主要关注的是,价值未知的原因是否与价值本身有任何关系;例如,如果您正在研究水文学,并使用土地覆盖率作为解释变量,那么如果洪水导致土地覆盖率未知,这是重要的信息,其意义不仅仅在于缺失价值。)
whuber

1
谢谢您,一些空值表示由于聚合单位较小而出于保密目的而省略的数据,而其他一些空值则完全不可用,但不是由于解释变量影响其他变量而导致的。我有真正的零值,其中零代表该特定多边形没有事件/发生率,我还有一些空值,其中缺少数据。因为我有大约29个解释变量开始,所以如果我取出多边形中包含空值的行,那么我将丢失279个中的8个多边形,我希望不必这样做。谢谢!
我的心跳

我很高兴您掌握有关失踪人员的信息和理论。您可能要对那些小单位保持谨慎,因为几乎所有变量的值都可能与它所代表的区域的大小有关,从而在缺失模式中产生了潜在的偏差。
ub

2
您可以通过引入变量来表示它们的存在,并用一个公共值(所有选择的值并不重要)对所有原始空结果进行编码来合并空值。对于每个包含空值的变量,您将需要一个单独的指示器。无论您做什么,都不要只将零替换为零(或任何其他常量)!空值表示完全不同于零的值。
ub

1
@whuber您的评论中似乎可能有足够的答案针对这一问题写出答案。
PolyGeo

Answers:


1

您可以尝试从周围的数据中猜测“空”值。那比将它们遗漏会更好,因为那样您就不会丢失数据。当然,您在选择值时必须谨慎。因为如果您的猜测是有偏见的,您的模型也会如此。

另请参见:http : //handbook.cochrane.org/chapter_16/16_1_2_general_principles_for_dealing_with_missing_data.htm

和:

警告:

每当使用shapefile时,请记住它们不能存储空值。因此,从非shapefile输入创建shapefile的工具或其他过程可能会将空值存储为零或一些非常小的负数(-DBL_MAX = -1.7976931348623158e + 308)。这可能会导致意外结果。另请参阅:shapefile输出的地理处理注意事项。(http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/geographically-weighted-regression.htm

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.