我有一个关于在存在强集群的数据上使用适当的引导技术的问题。
我的任务是评估保险索赔数据的多元混合效应预测模型,方法是对最新的索赔数据评分当前的基线模型,以便确定该模型对哪些医疗事件包含最高诊治频率的预测效果如何(较高95%)。敏感性,特异性和阳性预测值(PPV)将用于评估模型的有效性。
自举似乎是建立敏感性,特异性和PPV百分比置信区间的正确方法。不幸的是,鉴于索赔数据是1)由护理提供者关联的,2)分组为护理事件的,并且在护理事件的前几个月中进行了更频繁的拜访(因此存在一些自相关性),因此不宜采用单纯的引导程序。在这里,对移动块自举技术的一种变化是否合适?
或三步引导程序可能会起作用:1)从数据中的不同提供者处进行替换的样本,然后2)从所选提供者的不同护理阶段中进行替换的样本,然后3)每个内的不同主张所进行的替换样本选择的情节。
非常感谢您的任何建议!