时间线分析


10

我正在使用来自多个1年出生队列的数据(例如http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/)来研究一个人的出生顺序与以后的肥胖风险之间的关系。

一个关键的挑战是,出生顺序与其他特征(如产妇年龄,年轻和/或较年长的兄弟姐妹的数量以及生育间隔)相关联,这些特征也可能通过不同的机制影响结果。此外,这些因素对以后肥胖风险的任何影响都可以通过兄弟姐妹的性别组成来改变,包括“索引孩子”(出生队列的参与者)。

对于每个索引孩子,可以绘制一个时间表,显示该家庭的所有出生情况,其中母亲的年龄为时间变量。

在此处输入图片说明

我正在尝试确定分析此类数据的方法,其中事件的顺序,时间和性质可能都很重要。由于成员使用的应用程序多种多样,我在这里提出这个问题-我希望有人提出一些立即的建议,这些建议将使我花更长的时间才能单独找到。任何在正确方向上的轻推都将不胜感激。

相关问题: 我应该如何分析有关妇女出生间隔的数据?


1
+1。常见问题:您是否获得了父母BMI的数据?
Deer Hunter

是的,有一些索引儿童母亲的纵向人体测量数据。不幸的是,不包括兄弟姐妹,不包括任何家庭内部和家庭之间的家庭分析。
DL Dahly 2013年

目前,在时间轴问题上没有太多有用的想法。您可能希望将初生的产妇年龄作为另一个自变量。我认为您已经完成了探索性分析和可视化...
Deer Hunter

显然,产妇年龄很重要,这就是为什么以上时间表将产妇年龄作为时间变量的原因。我想我希望找到的是一种替代方法,它提供的不仅仅是将所有内容投入线性模型中。
DL Dahly 2013年

不确定这是否重要,但我认为出生体重或妇女子女的平均出生体重可能是一个有趣的协变量。另外,您能否提供有关结果的更多信息?您有重复的措施吗?
ReliableResearch 2013年

Answers:


2

您可能会考虑使用多级模型(混合回归)来估计家庭效应之间和之内的效应。一种可能的策略是使用计划的分层模型构建方法。例如,在单变量模型中测试每个潜在的预测变量。如果家庭之间的影响消除了出生顺序的影响,那么就强烈暗示出生顺序并不重要,而其他影响则很重要。举个例子说明出生顺序对智商有影响:

我希望这会有所帮助。


我也碰到过+1,但对于这个特定的分析,我没有任何关于兄弟姐妹的结果数据。
DL Dahly 2014年

0

我将其作为统计问题来对待,并且对医学问题没有特殊的了解。

查看您所参考的文章,我发现一个队列包含970个人。如果您有几组大致相同大小的数据,那么数据集的总体大小将为您提供选择合理的较大子集的机会,其中每个人的时间轴都满足特定条件。例如,一个子集可能包括,例如,所有孕产年龄为25-29岁的男性。对于这样的子集,对后来的肥胖与出生顺序进行适当测量的回归将消除对指数儿童性别差异的以后的肥胖的任何可能影响,并在很大程度上消除产妇年龄的任何可能影响。

将这种方法扩展到兄弟姐妹的性别并不容易,因为如果某个子集的一个条件是,例如,索引的孩子有一个较大的女性兄弟姐妹,这意味着索引的孩子本身不是长子,就缩小了范围回归中自变量的大小。但是,一种解决方法可能是使用“如果有”来定义条件。例如,可以定义一个子集,以包括产妇年龄在25-29岁之间且所有兄弟姐妹(如果有)的所有男性个体。这样的子集仍将包括具有任何出生顺序的个人。

如果一个子集由一组条件过于复杂而定义,那么它所包含的个体数量可能会太少,以至于由此产生的系数估计将太不精确而无用。如果采用这种方法,则在定义子集时,可能需要在消除尽可能多的可能影响和包括足够多的个人以产生有用结果之间进行判断上的权衡。


谢谢亚当的回答。但是,在这种情况下,我认为对样本进行分层不会告诉您除类似调整的模型之外的任何信息。最好是通过适当指定的线性模型来做到这一点……我只是希望看看其他领域的统计学家是否以不同的方式处理类似的问题。
DL Dahly

我同意-如果这就是您的意思-我的方法等同于使用大量指标变量对整个数据集进行一次回归。以产妇年龄为例,任何将其视为连续变量的模型的潜在问题是,它需要对功能形式进行假设(产妇年龄与后来的肥胖之间的关系可能是曲线的)。相比之下,使用针对孕产妇年龄段的一组指标变量的模型则不需要这样的假设,并且在这方面更为笼统。
亚当·贝利

0

我建议进行功能数据分析,但我怀疑您可能有很多孩子少的家庭,无法获得合理的估计。请继续阅读它,因为它可以满足您的需求。也许有人已经将其用于类似数据。

如果您不想做那么大的非参数化操作,则应使用临床专业知识来减少数据的维数。例如,模型中的一个变量可以是孩子的数量,另一个可以是孩子之间的平均年数,依此类推。如果这些变量有任何影响,即使您没有立即正确指定功能形式,也可能会显示出来。进一步的知识驱动的模型构建可能使您可以构建高度预测​​的模型-只需确保保留验证集即可!


我使用FDA,但不确定如何应用。我可以为每个索引子对象设置x轴= 0,并在该轴的+/-时间上绘制其他同级;并以孕妇年龄为y轴;然后为每个索引子项估计一个单调的功能数据对象...但是,一旦这样做,我就失去了有关同胞实际数目及其沿线下落位置的所有信息(因为现在所有内容都由功能)。FDA包括多种分析模式-您是否有更具体的想法?
DL Dahly 2013年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.