我有一堆变量,其中包含从第0天到第7天的纵向数据。我正在寻找一种合适的聚类方法,该方法可以将这些纵向变量(而不是案例)聚类为不同的组。我试图按时间分别分析此数据集,但结果很难合理地解释。
我调查了SAS程序的可用性,PROC SIMILARITY
因为它的网站上有一个示例。但是,我认为这不是正确的方法。先前的一些研究在每个时间点都使用了探索性因素分析,但是由于结果不合理,在我的研究中也不是一种选择。
希望可以在此处提供一些想法,并且可以使用已编译的程序(例如SAS或R)进行处理。任何建议表示赞赏!
这是一个简短的示例(很抱歉,数据和变量名之间的位置不一致):
id time V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
2 0 8 7 3 7 6 6 0 0 5 2
2 1 3 5 2 6 5 5 1 1 4 2
2 2 2 3 2 4 4 2 0 0 2 2
2 3 6 4 2 5 3 2 1 2 3 3
2 4 5 3 4 4 3 3 4 3 3 3
2 5 6 4 5 5 6 3 3 2 2 2
2 6 7 5 2 4 4 3 3 4 4 5
2 7 7 7 2 6 4 4 0 0 4 3
4 0 10 7 0 2 2 6 7 7 0 9
4 1 8 7 0 0 0 9 3 3 7 8
4 2 8 7 0 0 0 9 3 3 7 8
4 3 8 7 0 0 0 9 3 3 7 8
4 4 5 7 0 0 0 9 3 3 7 8
4 5 5 7 0 0 0 9 3 3 7 8
4 6 5 7 0 0 0 9 3 3 7 8
4 7 5 7 0 0 0 9 3 3 7 8
5 0 9 6 1 3 2 2 2 3 3 5
5 1 7 3 1 3 1 3 2 2 1 3
5 2 6 4 0 4 2 4 2 1 2 4
5 3 6 3 2 3 2 3 3 1 3 4
5 4 8 6 0 5 3 3 2 2 3 4
5 5 9 6 0 4 3 3 2 3 2 5
5 6 8 6 0 4 3 3 2 3 2 5
5 7 8 6 0 4 3 3 2 3 2 5
您能否再解释一下数据,或者提供缩短的样本?当您说“变量包含纵向数据”时,是指它们都是在7天之内对同一个人或事物进行的重复测量(因此可能是相关的)。
—
rosser 2011年
对于rosser:我已经附加了一部分数据。如您所述,它们是重复的测量:每个患者(ID)有10个测量值(V1〜V10),持续数天(day0〜day7)。
—
cchien