平滑-什么时候使用它,什么时候不使用?


18

威廉·布里格斯(William Briggs)的博客上有一篇很旧的文章,着眼于平滑数据的陷阱,并将平滑后的数据用于分析。关键参数是:

如果在一个疯狂的时刻,您对时间序列数据进行平滑处理并将其用作其他分析的输入,那么您将大大增加欺骗自己的可能性!这是因为平滑会感应出虚假信号,这些信号对于其他分析方法而言似乎是真实的。无论您做什么,都无法确定最终结果!

但是,我正在努力寻找有关何时进行平滑处理以及何时不进行平滑处理的全面讨论。

当使用该平滑数据作为其他分析的输入时,它只是不愿进行平滑处理吗?还是不建议进行平滑处理?相反,在某些情况下建议进行平滑处理吗?


1
时间序列分析的大多数应用都是某种类型的平滑,即使没有进行描述。平滑可以用作探索性或汇总性工具(在某些领域中,甚至是主要或唯一使用的方法),也可以用于去除出于某些目的被视为令人讨厌或次要的特征。
尼克·考克斯

4
免责声明:我尚未阅读引用的整个博客文章。我无法克服基本的拼写错误(“时代系列”,“蒙特卡罗尔”),而且其语气和风格也没有吸引力。但是我不建议尝试通过任何人的博客来学习时间序列分析或统计的原理。
尼克·考克斯

@NickCox同意,尤其是不是来自似乎有斧头可磨的博客。
Hong Ooi 2015年

@HongOoi是的!我从评论草稿中删除了一些选择短语,这些短语似乎与博客本身一样自以为是。
尼克·考克斯

1
我会把布里格斯写的所有东西都放一粒盐。
Momo

Answers:


16

指数平滑是非因果时间序列预测中使用的经典技术。只要您仅将其用于直接预测中,并且不将样本内平滑拟合用作另一种数据挖掘或统计算法的输入,那么布里格斯的批评就不适用。(因此,我对使用它“产生平滑的数据以供呈现”表示怀疑,正如Wikipedia所说-通过隐藏平滑的可变性,这很可能会产生误导。)

这是有关指数平滑的教科书介绍。

这是一篇(已有10年历史,但仍然很有意义)的评论文章。


编辑:似乎对布里格斯批评的有效性存有疑问,这可能受到其包装的影响。我完全同意Briggs的语气可能会令人生厌。但是,我想说明为什么我认为他有观点。

在下面,我模拟了10,000对时间序列,每个对100个观测值。所有系列都是白噪声,没有任何关联。因此,运行标准相关性测试应该得出p值,这些p值均匀地分布在[0,1]上。确实如此(直方图位于下面的左侧)。

但是,假设我们首先平滑每个序列,然后对平滑的数据应用相关性测试。出人意料的是:由于我们从数据中去除了很多可变性,因此我们得到的p值太小了。我们的相关性测试存在很大偏差。因此,我们将无法确定原始系列之间的任何关联,这就是布里格斯所说的。

真正的问题在于我们是否使用平滑数据进行预测(在这种情况下平滑有效),或者是否将其作为某种分析算法的输入,在这种情况下,去除变异性将在我们的数据中模拟比保证更高的确定性。输入数据的这种毫无根据的确定性会一直持续到最终结果,需要加以考虑,否则所有推论都将过于确定。(当然,如果我们使用基于“确定性较高”的模型进行预测,则预测间隔也会太小。)

n.series <- 1e4
n.time <- 1e2

p.corr <- p.corr.smoothed <- rep(NA,n.series)
set.seed(1)
for ( ii in 1:n.series ) {
    A <- rnorm(n.time)
    B <- rnorm(n.time)
    p.corr[ii] <- cor.test(A,B)$p.value
	p.corr.smoothed[ii] <- cor.test(lowess(A)$y,lowess(B)$y)$p.value
}

par(mfrow=c(1,2))
hist(p.corr,col="grey",xlab="",main="p values\nunsmoothed data")
hist(p.corr.smoothed,col="grey",xlab="",main="p values\nsmoothed data")

p值


1
对于良好的时间序列分析,我认为它是公理的,如果不显示原始数据,就不会显示平滑。
Nick Cox

1

声称平滑化不适用于建模分析,这指责其均方误差高于其他情况。均方误差或MSE可以分解为三项,即称为``偏差''的值的平方,方差和一些不可约的误差。(这在下面的引用中显示。)过度平滑的模型即使具有较低的方差也具有较高的偏差,而过于粗糙的模型则具有较高的方差和较低的偏差。

根本没有什么哲学意义。这是数学上的表征。它不取决于噪声的特征或系统的特征。

看到:

http://scott.fortmann-roe.com/docs/BiasVariance.html

https://galton.uchicago.edu/~lafferty/pdf/nonparam.pdf

http://www.inf.ed.ac.uk/teaching/courses/mlsc/Notes/Lecture4/BiasVariance.pdf (这是分解的结果。)

http://www.cs.columbia.edu/~blei/fogm/2015F/notes/regularized-regression.pdf (布莱(Blei)以不同的方式做同样的事情,并提出了当人们试图预测时会发生的事情。

古典统计几乎总是坚持无偏估计。1955年,斯坦福大学的统计学家查尔斯·斯坦(Charles Stein)发现,在重要的特殊情况下,存在无偏估计量的组合,它们的MSE较低,特别是被称为“詹姆斯·斯坦因估计”的。布拉德利·埃夫隆(Bradley Efron)撰写了一篇有关这场革命的见解非常平易近人的文章:http//statweb.stanford.edu/~ckirby/brad/other/Article1977.pdf

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.