我的一些解释变量对某些多边形有一些空值。
可以通过地理加权回归分析来处理这些问题,还是应该删除整个多边形和所有数据(该特定多边形的因变量和自变量)?
这些空值代表什么?值不适用或确实存在但未知吗?如果是后者,为什么未知?(主要关注的是,价值未知的原因是否与价值本身有任何关系;例如,如果您正在研究水文学,并使用土地覆盖率作为解释变量,那么如果洪水导致土地覆盖率未知,这是重要的信息,其意义不仅仅在于缺失价值。)
—
whuber
谢谢您,一些空值表示由于聚合单位较小而出于保密目的而省略的数据,而其他一些空值则完全不可用,但不是由于解释变量影响其他变量而导致的。我有真正的零值,其中零代表该特定多边形没有事件/发生率,我还有一些空值,其中缺少数据。因为我有大约29个解释变量开始,所以如果我取出多边形中包含空值的行,那么我将丢失279个中的8个多边形,我希望不必这样做。谢谢!
—
我的心跳
我很高兴您掌握有关失踪人员的信息和理论。您可能要对那些小单位保持谨慎,因为几乎所有变量的值都可能与它所代表的区域的大小有关,从而在缺失模式中产生了潜在的偏差。
—
ub
您可以通过引入变量来表示它们的存在,并用一个公共值(所有选择的值并不重要)对所有原始空结果进行编码来合并空值。对于每个包含空值的变量,您将需要一个单独的指示器。无论您做什么,都不要只将零替换为零(或任何其他常量)!空值表示完全不同于零的值。
—
ub
@whuber您的评论中似乎可能有足够的答案针对这一问题写出答案。
—
PolyGeo