时间序列重要性测试的时间分辨率是多少?


9

我需要有关池的适当级别的一些指导,以用于对时间序列数据进行均值检验。我担心时间伪复制和牺牲伪复制,这在此应用程序中似乎很紧张。这是参考心理研究而不是操纵性实验。

考虑一个监视练习:一个传感器系统在整个池塘的宽度和深度的多个位置测量溶解氧(DO)含量。每天记录两次每个传感器的测量值,因为已知溶解氧每天都会变化。将这两个值取平均值以记录每日值。每周一次,将每日结果在空间上汇总,以得出整个池塘每周一次的DO浓度。

这些每周的结果会定期报告,并进一步汇总-将每周的结果平均以得出池塘每月的DO浓度。将月度结果取平均值即可得出年值。每年的平均值本身是平均值,以报告池塘的十年溶解氧浓度。

目的是回答以下问题:池塘在X年的DO浓度是较高,较低还是与Y年的浓度相同?最近十年的平均溶解氧浓度是否与前十年的平均溶解氧浓度不同?池塘中的溶解氧浓度会响应大量的大量输入,因此变化很大。需要进行重要性检验。该方法是使用均值的T检验比较。假定十年值是年均值,而年值是月均值,这似乎是适当的。

问题是 –您可以从每月DO值或每年DO值计算十年平均值和这些平均值的T值。平均值当然不会改变,但是置信区间和T值的宽度会改变。由于使用月度值可获得较高的N数量级,因此,如果您选择该路线,则CI通常会明显收紧。对于在均值上观察到的差异的统计显着性而言,这可以得出与使用年度值相反的结论,即对相同数据使用相同的检验。 对这种差异的正确解释是什么?

如果使用月度结果来计算测试统计量的年代平均值差异,那么您是否违反了时间伪复制?如果使用年度结果来计算年代际测验,您是在牺牲信息并因此进行伪复制吗?


您的问题相当棘手...我正在考虑。
deps_stats 2011年

Answers:


1

我相信您正在尝试使用适用于独立观察的统计方法,同时又将数据进行临时和空间关联。如果您有5个小时的观测值,并决定将其重新声明为每分钟241个观测值,那么相对于这241个值的平均值,您确实没有240个自由度。自相关可能会夸大“ N”的大小,从而产生错误的不确定性陈述。您需要做的是找到一个人/一些教科书/一些网站/ ....来教您有关时间序列数据及其分析的知识。一种开始的方法是使用GOOGLE“帮助我了解时间序列”并开始阅读/学习。网络上有很多资料。http://www.autobox.com/AFSUniversity/afsuFrameset.htm。我提到这一点是因为我仍然与这家公司及其产品相关联,因此我的评论是“有偏见和自以为是”,而不仅仅是出于自我服务。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.