仿真研究:如何选择迭代次数?


11

我想使用“模型1”生成数据,并使其与“模型2”匹配。基本思想是研究“模型2”的鲁棒性。我对95%置信区间的覆盖率(基于正常近似值)特别感兴趣。

  • 如何设置迭代次数?
  • 大于必需的复制量是否会导致虚假的偏差,这是真的吗?如果是这样,那怎么办?

“ 95%置信区间的覆盖率”是什么意思?如果置信区间是准确的或良好的近似区间,则它会在大约95%的时间内覆盖参数的真实值。
Michael R. Chernick

1
如果您要基于模型2为在模型1下生成的数据生成置信区间,这似乎表明这两个模型是相关的,并且包含一些相同的参数。你能解释更多吗?另外,当您在第二个要点中说“虚假”时,您是说错了还是不重要?大量的仿真不应该产生偏差,但是它可以揭示偏差较小的情况下您不会看到的实际重要性不大的偏差,类似于当您检测到很小的影响时(即获得统计显着性)样本量很大。
2012年

@Michael Chernick:例如,如果标准误差太小,可能会导致覆盖不足。我已经对问题进行了编辑,以指定比我使用基于正态近似的置信区间。
user7064 2012年

@Macro:“模型1”生成带有异方差误差项的普通数据,“模型2”是标准线性模型。
user7064 2012年

Answers:


10

根据您的后续评论,听起来好像您正在尝试在真实误差方差不是恒定的情况下假设恒定误差方差时估计置信区间的覆盖率。

我对此的看法是,对于每次运行,置信区间要么覆盖真实值,要么不覆盖真实值。定义一个指标变量:

ÿ一世={1个一世F ŤHË 一世ñŤË[Rv一种 CØvË[Rs0一世F 一世Ť dØËs ñØŤ

这样,您感兴趣的覆盖率就是,您可以通过样本比例来估算,我认为这是您所建议的。Ëÿ一世=p

如何设置迭代次数?

我们知道伯努利试验的方差为,您的模拟将生成IID贝努利试验,因此,基于模拟的p估计量的方差为p 1 - p / n,其中n为模拟次数。您可以选择n来尽可能缩小此方差。这是一个事实:p 1 - p / Ñ 1 / 4 Ñp1个-ppp1个-p/ñññ

p1个-p/ñ1个/4ñ

所以,如果你想方差小于某个预先设定的阈值,,那么你可以选择确保该ñ 1 / 4 δδñ1个/4δ

在更一般的设置中,如果您尝试通过仿真调查估计量的抽样分布的属性(例如均值和方差),则可以基于要在类似条件下达到的精度来选择仿真次数此处描述的时尚。

还要注意,当变量的均值(或其他时刻)是感兴趣的对象时(如此处所示),您可以使用正态逼近(即中心极限定理)基于模拟为它构造一个置信区间,如MansT的好答案中所述。随着样本数量的增加,这种正态近似会更好,因此,如果您计划通过吸引中心极限定理来构建置信区间,则将希望足够大以使其适用。对于二进制情况,就像您在此处看到的那样,即使n pn 1 - p 相当适中(例如20 ,这种近似也似乎很好。ññpñ1个-p20

大于必需的复制量是否会导致虚假的偏差,这是真的吗?如果是这样,那怎么办?

正如我在评论中提到的那样-这取决于您虚假的意思。大量的模拟不会在统计意义上产生偏差,但可能会显示出不重要的偏差,只有在天文数字较大的样本量下才可以注意到。例如,假设错误指定的置信区间的真实覆盖概率为。然后,从实际意义上讲,这并不是一个真正的问题,但是只有运行大量仿真后,您才可能发现这种差异。94.9999


10

我经常将置信区间的宽度用作确定所需迭代次数的快速方法。

当将“模型1”中的数据拟合到“模型2”中时,令为95%置信区间的真实覆盖率。如果X是的次数,该置信区间覆盖在真参数值Ñ迭代,那么X ÑÑ p pXñX一世ññp

估计p = X / Ñ具有均值p和标准偏差p^=X/ñp。对于大型Ñ p是大约正常和 p ±1.96p1个-p/ññp^给你的约95%置信区间p。由于已知(将GESS),该p0.95,由此得出该间隔的宽度为大约21.96p^±1.96p^1个-p^/ñpp0.9521.960.950.05/ñ

0.1ñ

0.1=21.960.950.05/ñ

ñ


(+1)看起来我们几乎同时提交了非常相似的答案,但我认为所使用的不同语言可能对某些人有用。
2012年

是的,的确,我仍然不知道接受哪个答案!无论如何,两者均为+1!
user7064 2012年

1
@Macro:您也可以+1。当然,方差和间隔宽度或多或少是等效的。伟大的思想家会思考-我们的思想家也是如此。;)
MånsT2012年

ñ=21.650.950.05/0.012

0

人口标准差ñd95d=1.96×流行音乐ññ=1.96×流行音乐2d2

进行更多的模拟(假设所有样本都是由随机过程生成的)不会影响准确性或偏差方面的估计。

95ñp1个-pñ


4
嗨,迈克尔。我认为这个答案没有重点。OP尝试研究当您假设常数方差但真实方差不是常数时如何改变置信区间的覆盖范围属性。
2012年

@Macro:你是对的。我特意将这个问题放在更广阔的背景下,以避免针对假设恒定方差的问题做出特定的回答。
user7064 2012年

@Macro那不是我回答的问题的一部分。显然,这在以后得到澄清。似乎还有趣的是使用正态近似的置信区间的准确性。似乎没有任何答案可以解决此问题。
2012年

4
@Michael,是的,我知道-我的意思是,您(和我)要求澄清,但是您在发布答案之前没有等待澄清。回复:您的第二条评论,您可以通过这种方式调查任何间隔的覆盖范围属性,而不管它是否基于法线近似值。如果您认为现有答案遗漏了一些与众不同的内容,请编辑您的答案,以便我们都能学习。
2012年

@Macro当然,我同意你的观点。我为OP的利益编辑了答案。我怀疑内容中没有您不知道的内容。
2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.