多次插补后合并校准图


15

我想对多次插补后合并校准图/统计数据提出建议。在开发统计模型以预测未来事件的设置中(例如,使用医院记录中的数据预测医院出院后的存活或事件),人们可以想象有很多缺失的信息。多重插补是处理这种情况的一种方式,但是导致需要合并每个插补数据集的测试统计数据,并考虑到由于插补固有的不确定性而导致的其他可变性。

我知道有多个校准统计信息(hosmer-lemeshow,Harrell的Emax,估计的校准指数等),可能适用“常规” Rubin合并规则。

但是,这些统计信息通常是校准的总体度量,没有显示模型的特定未校准区域。因此,我宁愿看一下校准图。遗憾的是,我对如何“汇总”图表或背后的数据(每个人的预测概率和每个人的观察到的结果)一无所知,并且在生物医学文献(我熟悉的领域)中找不到很多东西,或在这里,在CrossValidated上。当然,查看每个插补数据集的标定图可能是一个答案,但是当创建许多插补集时(可能会很麻烦)。

因此,我想问一问是否存在可以在多次插补之后合并校准图的技术?


是否可以直接合并自举的样本并评估该样本的校准?
AdamO '18年

@AdamO直接池到底意味着什么?您指的是哪些引导程序样本?
IWS

2
抱歉让我备份,(我认为MI是引导程序)。我是说,如果您的n是1,000,并且您有5个MI数据集,为什么不从5000中创建一个校准图,并以这5,000中所需的方式比较观察/期望的结果?
AdamO

@AdamO听起来很有趣,它需要调整功能,但同时还要提供一个置信区间。有任何参考或理论支持这一想法吗?
IWS

2
没有参考文献,我们最近发表了一篇论文,其中我们声明没有证明通过以这种方式将它们合并在一起就获得了引导程序标准错误和多重插补的推断。我认为您可以说,分析的目的是在0.05的水平上进行测试,即期望/观察比率或差异在正态分布范围内,并且分位数估计值对样本量不变,因此基于95%CI进行测试不受池影响。
AdamO '18年

Answers:


1

[...]如果您的n为1,000,并且您有5个MI数据集,为什么不从5000中创建单个校准图,并以所需的方式比较这5,000中的观测/期望值?

关于参考:

没有参考文献,我们最近发表了一篇论文,其中我们声明没有证明通过以这种方式将它们合并在一起就获得了引导程序标准错误和多重插补的推论。我认为您可以说,分析的目的是在0.05的水平上进行测试,即期望/观察比率或差异在正态分布范围内,并且分位数估计值对样本量不变,因此基于95%CI进行测试不受池影响。


1
我已通过@AdamO将此评论复制为社区Wiki答案,因为该评论或多或少是对该问题的答案。答案和问题之间存在巨大差距。问题的至少一部分是在评论中回答了一些问题:如果回答问题的评论改为回答,那么未回答的问题就会更少。
mkt-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.