重复测量随时间的小


14

我获得了用于分析研究的数据,以研究在四个不同时间点(治疗前,治疗结束的当天,治疗后4周和治疗后2-4个月)铁水平的影响。没有对照组。他们正在寻找在三个治疗后时间点的铁水平是否显着增加到治疗前(基线)水平的铁水平。11名患者具有基线水平,但只有8名患者具有所有4个时间点的完整数据(每个时间点 = 11、10、9和8)。不仅测量了铁水平,而且还在每个时间点采取了其他两个实验室测量值以与基线进行比较。ñ

关于如何分析,我有几个问题。我最初认为RM方差分析适用于分析此数据,但我担心样本量小,数据丢失以及数据的非正态分布。然后,我考虑使用Wilcoxon符号秩检验将每个后处理量度与基线进行比较,但随后遇到了多个比较的问题。但是,我读了一些文献,淡化了需要进行多次比较的情况。因此,总的来说,我正在处理小样本量,不完整的数据和多次比较(以及是否必要)。

我希望这一切都是有道理的。我是CrossValidated的新手,它是由同事在这里指导的,可以作为向经验丰富的统计学家学习的地方,因此,我感谢任何建议!谢谢!


编辑以添加来自注释的原始数据:

总共有四个时间点,结果变量是连续的。例如,每个时间点的结果类似于以下内容:

 Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 
 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
 2nd Post (n=9):  [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
 3rd Post (n=8):  [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]

1
如果添加可重现的示例(或原始数据),将很有帮助。
LadislavNaďo2013年

结果变量是连续的。例如,每个时间点的结果类似于以下内容:基线级别n = 11:[2、7、7、3、6、3、2、4、4、3、14]。第一个帖子n = 10 [167,200,45,132,。,245,199,177,134,298,111]。第二帖子n = 9 [75、43、23、98、87,.. 300,。,118、202、156]。第三职位等级n = 8 [23,34,98,112,。,200,。,156,54,18,。]。总共有四个时间点。
msturm17,2013年

Answers:


5

我重新考虑了您的问题,发现弗里德曼测试是一种采用重复测量的单向方差分析非参数版本

希望您掌握一些基本技能R

# Creating a source data.frame
my.data<-data.frame(value=c(2,7,7,3,6,3,2,4,4,3,14,167,200,45,132,NA,
245,199,177,134,298,111,75,43,23,98,87,NA,300,NA,118,202,156,23,34,98,
112,NA,200,NA,156,54,18,NA),
post.no=rep(c("baseline","post1","post2","post3"), each=11),
ID=rep(c(1:11), times=4))

# you must install this library
library(pgirmess)

执行测试Friedman的测试...

friedman.test(my.data$value,my.data$post.no,my.data$ID)

    Friedman rank sum test

data:  my.data$value, my.data$post.no and my.data$ID
Friedman chi-squared = 14.6, df = 3, p-value = 0.002192

然后通过非参数事后检验找出在哪些组之间存在差异。在这里,您可以进行所有比较。

friedmanmc(my.data$value,my.data$post.no,my.data$ID)
Multiple comparisons between groups after Friedman test 
p.value: 0.05 
Comparisons
               obs.dif critical.dif difference
baseline-post1      25     15.97544       TRUE
baseline-post2      21     15.97544       TRUE
baseline-post3      20     15.97544       TRUE
post1-post2          4     15.97544      FALSE
post1-post3          5     15.97544      FALSE
post2-post3          1     15.97544      FALSE

如您所见,仅基线(第一时间点)在统计上与其他基线有所不同。

我希望这能帮到您。


1
拉迪斯拉夫,这是对这个问题的绝妙答案。它非常彻底和完整。我看到的唯一问题是,Kruskal-Wallis方差分析也假设观察值独立,因此自变量的每个级别都有不同的主题,在这种情况下,我们没有,因为我们遵循相同的11患者跨越4个时间点。您对此有任何意见还是打算解决此问题的其他方法?非常感谢!
马特·赖兴巴赫

我删除了上面的评论。我终于找到了更好的测试。请享用 !
LadislavNaďo2013年

这不是我最初的问题,@ msturm17,将不得不接受您的回答,不过我给了您赏金!
马特·赖兴巴赫2013年

谢谢拉迪斯拉夫,抽出宝贵时间对我的问题进行了彻底的回答!
msturm17年

2

如果您不知道各个变化随时间的分布,则无法用患者之间差异的分布来近似。例如,如果您有10位患者在治疗前和治疗后分别具有铁水平(510,520,...,600)和(520,530,...,610),则Kruskal-Wallis ANOVA(或任何其他类似算法)将要求赔偿铁水平没有明显变化。

恕我直言,在没有对照组的情况下,您能做的最好的事情就是计算有多少患者铁水平升高和有多少患者铁水平降低,并检验其意义。

就是说,如果KW ANOVA告诉您铁水平很高,那就是(无误报)。


1
是的,没有误报!哈哈,谢谢你的回答。您如何建议我们“检验这一点的意义”以计算有多少患者铁水平升高而有多少患者铁水平降低?谢谢!
Matt Reichenbach

2
ñp=2-+ñķ=0+ñķ

谢谢!这是查看我的问题的另一种有趣方式,它将看到它如何应用于我的数据。
msturm17年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.