估计随着时间的变化


10

我有一个数据集,其中包含来自约2500个个体的约7,500个血液测试。我试图找出血液测试的变异性是随着两次测试之间的时间而增加还是减少。例如-我抽取您的血液进行基线测试,然后立即抽取第二个样品。六个月后,我画了另一个样本。人们可能期望基线和立即重复测试之间的差异小于基线和六个月测试之间的差异。

下图上的每个点反映了两次测试之间的差异。X是两次测试之间的天数;Y是两个测试之间差异的大小。如您所见,测试并非沿X均匀分布-这项研究并非旨在解决这个问题。由于这些点的平均高度重叠,因此基于28天的窗口,我包括了95%(蓝色)和99%(红色)的分位数线。这些显然被更极端的因素所牵制,但您明白了。

替代文字http://a.imageshack.us/img175/6595/diffsbydays.png

在我看来,可变性相当稳定。如果有的话,在短时间内重复进行测试会更高-这是违反直觉的。我该如何系统地解决这个问题,并考虑每个时间点的n值变化(某些时期根本没有测试)?非常感谢您的想法。

仅供参考,这是测试与重新测试之间的天数分布:

替代文字http://a.imageshack.us/img697/6572/testsateachtimepoint.png


+1有趣的真实案例!您能帮助我们了解什么是验血吗?(如何计算)
罗宾吉拉德

有一篇关于LFT(肝功能测试)的文章,它似乎周期性地变化(以月为单位)。我认为这是《内科医学年鉴》中的内容。
Ming K 2010年

当然-简要地说,这是对潜伏性结核感染的测试。从患者体内抽取血液到三支试管中:一根无抗原,一根已选择TB抗原,另一根有丝分裂原。然后,我们将不含抗原的试管中的免疫反应量与具有结核菌的试管中的免疫反应量进行了比较-如果它们在TB管中的反应强烈增强,则它们可能具有潜在的TB。(有丝分裂原管作为检查以确保该人完全能够产生免疫反应-大多数人对此反应非常强烈)
Matt Parker 2010年

Answers:


3

从您的描述中,我看不出有任何理由将“基准测试”与立即绘制的“第二个样本”区分开。它们仅是2个基线测量值,并且可以在此基础上计算(基线)方差。相对于第三个“六个月”样本,绘制两个基线测量值的平均值会更好。

问题在于6个月的样本。由于此时仅采集一个样本,因此无法估算此时的“变异性”,也无法将采样变异与TB读数的纵向(实际)变化区分开。

如果我们认为这是一个纵向数据分析问题,我们可能会选择一个随机截距(基线TB)和一个随机斜率(以适应6个月的TB)。可以根据两个基线测量值和第三次六个月测量值的斜率来估计采样变异性。如果在六个月内没有对频道进行强有力的分布假设(例如假设没有变化),我们将无法估计6个月的变异性。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.