我有六个月间隔四次对2500人进行血液测试的测试结果。结果主要包括两种免疫反应指标:一种在存在某些结核病抗原的情况下进行,另一种在不存在的情况下进行。目前,每项测试都会根据抗原反应和无反应之间的差异来评估阳性或阴性(其想法是,如果您的免疫系统对TB抗原有反应,您可能会在某个时候暴露于细菌本身)。从本质上讲,该测试假设未暴露个体的零和结核病反应分布应基本相同,而患有结核病的人的结核病反应将来自不同的分布(较高值)。 警告:响应非常非常不正常,并且在自然地板和工具截断的天花板上都出现了值聚集。
但是,在这种纵向情况下,我们似乎很清楚地看到,由于抗原和无应答的波动(通常很小),我们会得到“假阳性”(我担心潜伏性结核没有实际的金标准)。尽管在某些情况下可能很难避免这种情况(您可能只有一次机会对某人进行测试),但在许多情况下,每年大约需要对人们进行结核病常规检测-在美国,这对于医护人员来说很常见,军队,无家可归者住在庇护所等。忽略先前的测试结果似乎很可耻,因为现有标准恰好是横截面的。
我认为我想做的是我粗略地将其视为纵向混合分析。就像横截面标准一样,我希望能够估计从同一分布中得出个体的TB和无应答的概率-但要使该估计值包含先前的测试结果以及来自样本的信息整体(例如,我是否可以使用个体内变异的样本范围分布来改善对特定个体零或TB分布的估计?)。当然,估计的概率将需要能够随时间变化,以考虑新感染的可能性。
我已经全神贯注地试图以不同寻常的方式思考这个问题,但是我觉得这种概念化与我将要提出的任何想法一样好。如果没有任何意义,请随时进行澄清。如果我对情况的理解似乎不对,请随时告诉我。非常感谢你的帮助。
针对Srikant: 这是使用两个连续(但非正常且被截断)的测试结果进行潜在分类(是否感染TB)的情况。现在,该分类使用截止值完成(简化形式为TB-nil> .35->正数)。测试结果显示为(零,TB,结果),基本原型*为:
可能的负数:(0.06,0.15,-)(0.24,0.23,-)(0.09,0.11,-)(0.16,0.15,-)
可能的正数:(0.05,3.75,+)(0.05,1.56,+)(0.06 ,5.02,+)(
0.08,4.43 ,+)摇摆器:(0.05,0.29,-)(0.09,0.68 ,+)(0.08,0.31,-)(0.07,0.28,-)
Wobbler的第二项测试的阳性结果显然是一种畸变,但您将如何建模?我的思路之一是使用重复测量多级模型来估计每个时间点的结核病和无结核病之间的“真正差异”,但我真正想知道的是该人的无病应答和结核病应答它们来自相同的分布,或者它们的免疫系统是否识别TB抗原并激活,从而产生增强的反应。
至于除了感染以外还可能导致阳性测试的原因:我不确定。我怀疑结果通常只是个人差异,但肯定还有其他因素的可能性。我们确实在每个时间点都有调查表,但是我还没有研究太多。
*捏造但说明性的数据