我需要有关池的适当级别的一些指导,以用于对时间序列数据进行均值检验。我担心时间伪复制和牺牲伪复制,这在此应用程序中似乎很紧张。这是参考心理研究而不是操纵性实验。
考虑一个监视练习:一个传感器系统在整个池塘的宽度和深度的多个位置测量溶解氧(DO)含量。每天记录两次每个传感器的测量值,因为已知溶解氧每天都会变化。将这两个值取平均值以记录每日值。每周一次,将每日结果在空间上汇总,以得出整个池塘每周一次的DO浓度。
这些每周的结果会定期报告,并进一步汇总-将每周的结果平均以得出池塘每月的DO浓度。将月度结果取平均值即可得出年值。每年的平均值本身是平均值,以报告池塘的十年溶解氧浓度。
目的是回答以下问题:池塘在X年的DO浓度是较高,较低还是与Y年的浓度相同?最近十年的平均溶解氧浓度是否与前十年的平均溶解氧浓度不同?池塘中的溶解氧浓度会响应大量的大量输入,因此变化很大。需要进行重要性检验。该方法是使用均值的T检验比较。假定十年值是年均值,而年值是月均值,这似乎是适当的。
问题是 –您可以从每月DO值或每年DO值计算十年平均值和这些平均值的T值。平均值当然不会改变,但是置信区间和T值的宽度会改变。由于使用月度值可获得较高的N数量级,因此,如果您选择该路线,则CI通常会明显收紧。对于在均值上观察到的差异的统计显着性而言,这可以得出与使用年度值相反的结论,即对相同数据使用相同的检验。 对这种差异的正确解释是什么?
如果使用月度结果来计算测试统计量的年代平均值差异,那么您是否违反了时间伪复制?如果使用年度结果来计算年代际测验,您是在牺牲信息并因此进行伪复制吗?