背景
我正在设计一个结合了一系列模型输出的蒙特卡洛模拟,并且我想确保该模拟将使我能够对模拟结果的概率和该概率估计的精度提出合理的要求。
模拟将发现从特定社区招募的陪审团将某被告定罪的可能性。这些是模拟步骤:
使用现有数据,通过对人口预测变量上的“初选投票”进行回归,生成逻辑概率模型(M)。
使用蒙特卡洛方法模拟M的 1,000个版本(即,模型参数的系数的1000个版本)。
选择模型的1,000个版本之一(M i)。
Empanel 1,000陪审团通过从具有特定人口特征分布的个人“社区”(C)中随机选择1,000组12个“陪审员”来进行。
使用M i确定性地计算每个陪审员第一次有罪表决的概率。
将每个“陪审员”的可能的票数投给确定票(根据票数是大于还是小于0-1之间的随机选择值)。
通过使用陪审团定罪的概率模型(从经验数据得出)来确定每个“陪审团”的“最终投票”,条件是陪审员在第一次投票中对定罪投票的比例。
存储有1000个陪审团(PG i)的有罪判决的比例。
对M的1,000个模拟版本中的每一个重复步骤3-8 。
计算PG的平均值,并将其报告为C中定罪概率的点估计 。
确定PG的2.5和97.5个百分位数,并将其报告为0.95置信区间。
我目前正在使用1,000名陪审员和1,000名陪审员的理论,即从概率分布(C或M版本的人口统计特征)中抽取1000次随机抽奖将填补该分布。
问题
这将使我能够准确地确定估计的精度吗?如果是这样,我需要为每个PG i计算覆盖几个陪审团,以涵盖C的概率分布(因此避免了选择偏差);我可以使用少于1000个吗?
非常感谢您的帮助!