更新2014-01-15
我意识到我没有回答Danica最初的问题,即间接调整比例禁用的误差范围是否大于ACS中相同比率的误差范围。答案是:如果公司类别比例与州ACS比例没有太大差异,则下面给出的误差幅度将小于ACS误差幅度。原因:间接费率将组织工作类别的人员人数(或相对比例)视为固定数字。ACS对残疾比例的估计实际上需要对这些比例进行估计,并且误差幅度会增加以反映这一点。
为了说明这一点,将禁用率写为:
P^一dĴ= ∑ n一世ñp一世^
其中是ACS 中类别中的估计禁用率。p^一世一世
另一方面,ACS的估计比率实际上是:
P^一Ç 小号= ∑ (N一世ñ)ˆp一世^
其中和分别是人口类别和总体总数, 是类别的人口比例。ñ一世ñNi/Ni
因此,由于除了之外还需要估计,因此ACS速率的标准误差将更大。Ni/Npi
如果组织类别比例和人口估计比例相差很大,则。在我构建的两个类别的示例中,类别以比例和。估计比例禁用的标准误差为。SE(P^adj)>SE(P^acs)N1/N=0.7345N2/N=0.2655SE(P^acs)=0.0677
如果我将0.7345和0.2655设为固定值和(间接调整方法),则小得多。如果相反,则且, ,与大致相同 在极端且,。如果组织和人口类别的比例差异如此之大,我会感到惊讶。如果没有,我认为使用ACS误差范围作为保守的(可能非常保守的)真实误差范围的估计是安全的。n1/nn2/nSE(P^adj)=0.0375n1/n=0.15n2/n=0.85SE(P^adj)=0.0678SE(P^acs)n1/n=0.001小号È (P一d Ĵ)= 0.079n2/n=0.999SE(P^adj)=0.079
更新2014-01-14
简短答案
我认为,不提供CI或误差范围(CI长度的一半)而提出这样的统计数据是不负责任的。要计算这些值,您需要下载并分析ACS公用微数据样本(PUMS)(http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/)。
长答案
这实际上并不是ACS的重新加权。它是间接标准化的一种形式,是一种流行病学的标准程序(google或查看任何Epi文本)。在这种情况下,状态ACS工作(类别)残疾率由组织工作类别员工人数加权。这将计算组织中预期的残疾人人数E
,并将其与观察到的人数进行比较O
。比较的通常量度是标准化比率R= (O/E)
。(通常的术语是“ SMR”,代表“标准化死亡率”,但此处的“结果”是残疾。)R
也是观察到的残障率(O/n)
与间接标准化率的比率(E/n)
,其中n
是组织的雇员人数。
在这种情况下,似乎只需要一个E
或的配置项E/n
,因此我将从此开始:
如果
n_i = the organization employee count in job category i
p_i = disability rate for job category i in the ACS
然后
E = sum (n_i p_i)
的方差E
为:
var(E) = nn' V nn
其中,nn
是组织类别计数的列向量,V
是ACS类别残障率的估计方差-协方差矩阵。
另外, se(E) = sqrt(var(E))
和se(E/n) = se(E)/n
。
E的90%CI为
E ± 1.645 SE(E)
除以n
得到CI E/n
。
要进行估算,var(E)
您需要下载并分析ACS公用微数据样本(PUMS)数据(http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/)。
我只能谈论var(E)
Stata 中的计算过程。我不知道您是否可以使用该功能,因此我将延迟详细信息。但是,对R或(可能是)SAS的调查功能了解的人也可以从上面的公式提供代码。
比率的置信区间 R
的置信区间R
通常基于的泊松假设O
,但该假设可能不正确。
我们可以考虑O
并E
保持独立,因此
log R = log(O) - log(E) ->
var(log R) = var(log O) + var(log(E))
var(log(E))
可以在计算以后再作为一个Stata步骤进行计算var(E)
。
根据泊松独立性假设:
var(log O) ~ 1/E(O).
像Stata这样的程序可以拟合负二项式模型或广义线性模型,并为您提供更准确的方差项。
的近似90%CI为log R
IS
log R ± 1.645 sqrt(var(log R))
可以对端点求幂以获得CI R
。