人口密度估计模型


14

通过为每个形状(例如人口普查区,地区,县,州等多边形)分配恒定的人口/面积值,可以使用(人口,面积,形状)数据库来绘制人口密度图。但是,种群通常在其多边形内并不是均匀分布的。 对称映射是通过辅助数据细化这些密度估计的过程。正如最近的评论所指出的,是社会科学中的一个重要问题。

然后,假设我们有一个辅助的土地覆盖图(或任何其他离散因子)。在最简单的情况下,我们可以使用明显不适合居住的区域(例如水域)来划定人口不在的区域,并相应地将所有人口分配到其余区域。更一般地,每个单元人口普查被雕刻成具有表面区域部分,。因此,我们的数据集被扩充到元组列表ķ X Ĵ = 1 2 ... ķjkxjii=1,2,,k

(yj,xj1,xj2,,xjk)

其中是单位的总体(假定无误差地测量),并且-尽管并非严格如此-我们可以假设每个也都被精确测量。用这些术语,目标是将每个分成一个总和 j x j i y jyjjxjiyj

yj=zj1+zj2++zjk

其中每个和估计居住在土地覆盖类别单元的人口。估计需要无偏见。此分区通过将密度分配给人口普查多边形与土地覆盖类别的交点来细化人口密度图。 ž Ĵ Ĵ ž Ĵ / X Ĵ Ĵ zji0zjijizji/xjijthith

此问题与标准回归设置的显着方式不同:

  1. 每个的分区必须精确。 yj
  2. 每个分区的组件必须为非负数。
  3. (通过假设)任何数据均无错误:所有人口计数和所有区域都是正确的。 X Ĵ yjxji

解决方案有很多方法,例如“ 智能dasymetric映射 ”方法,但是我所读过的所有方法都具有临时性元素,并且很可能会出现偏差。我正在寻找能够提出创新的,易于计算的统计方法的答案。立即申请涉及c 的集合 -人口普查单位平均有40人每人(虽然相当大的部分有0人)和大约十几土地覆盖类。 10 6105106


格式问题现已修复。这是一个错误。
罗伯·海德曼

@Rob谢谢,并感谢所有查看此内容的人:在删除您的评论之前,我已经看到您的评论,并感谢您的努力。
ub

1
还有一个:P. A. Zandbergen和D. A. Ignizio,“小面积人口估计的Dasymetric映射技术的比较”,制图学和地理信息科学37,第1期。3(2010):199–214。ingentaconnect.com/content/acsm/cagis/2010/00000037/00000003/… 似乎需要进行混合。
fgregg 2011年

1
这篇文章可能有用:Hwahwan Kim和Xiaoxiao Yao,“重新探讨了拟预防性插值:与dasymetric映射方法的集成”,《国际遥感杂志》 31,第1期。21(2010):5657. informaworld.com/10.1080/01431161.2010.496805
fgregg

1
您知道,等轴测图映射最终是一个生态推理问题。K. Imai的最新工作可能会有所帮助:pan.oxfordjournals.org/content/16/1/41.abstract
fgregg 2011年

Answers:


4

您可能要检查工作的dasymetric映射米切尔兰福德的。

他建立了代表威尔士人口分布的栅格,他的一些方法论方法可能在这里有用。

更新:您可能还会看看Jeremy Mennis的作品(尤其是 两篇文章)。


2
谢谢。这项工作为进入有关等距映射的最新研究提供了一个指南。
ub

2

xji

zji=f(xji,β)

f(.)

zji=f(xji,β)+ϵji

哪里,

ϵjiN(0,σ2)

关于误差项的分布误差假设仅用于说明目的。如有必要,我们可以适当地更改它。

yjif(.)

iϵji=0

if(xji,β)=yj

表示的堆叠矢量通过和的层叠确定性术语由。因此,我们有: z j f x j iβ f jzjizjf(xji,β)fj

zjN(fj,σ2I)I(fje=yj)I((zjfj)e=0)

哪里,

e是适当维数的向量。

第一个指标约束捕捉到确定性项之和应为的想法,第二个指标约束捕捉误差残差应为0的想法。yj

由于我们正在精确地分解观察到的模型选择比较棘手。也许,一种选择模型的方法是选择产生最低误差方差的模型,即产生最低估计值的模型。σ 2yjσ2

编辑1

再想一想,上面的表述可以简化,因为它比需要的约束更多。

zji=f(xji,β)+ϵji

哪里,

ϵjiN(0,σ2)

zjizjf(xji,β)fj

zjN(fj,σ2I)I(zje=yj)

哪里,

e是适当维数的向量。

的约束可确保精确分解。zj


2
@Srikant谢谢。提出问题时,我一直在沿着类似的思路思考,此后测试了GLM(带有线性链接的Poisson分布)以及其他一些模型。不幸的是,现在看来,任何仅基于土地覆盖类型和比例的模型都不能很好地工作:这些数据的样本表明,人口格局取决于更大的空间环境。然后,至少需要在线性模型中包括空间滞后协变量。
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.