Answers:
其实不行
这样的问题有点笼统,并把两件事联系在一起。过度拟合通常是与概括描述相反的品质;在某种意义上,过度拟合(或过度训练)的网络将具有较小的泛化能力。这种质量主要取决于网络体系结构,培训和验证过程。数据及其属性仅以“训练过程发生的内容”形式输入。这或多或少是“教科书知识”;您可以尝试James,Witten,Hastie和Tibshirani撰写的“统计学习入门”。或Bishop的“模式识别”(我最喜欢的关于一般主题的书)。或也由Bishop撰写的“模式识别和机器学习”。
对于关联本身:考虑具有特定维度的输入空间。无论您使用什么变换,维数都将保持不变-线性代数如此。在一种情况下,给定的基数将完全不相关-这就是在解除变量相关性或仅应用PAT(原理轴变换)时得到的结果。为此,请拿任何线性代数本。
由于具有适当架构的神经网络可以对任何(!)函数进行建模,因此可以放心地假设,它也可以首先对PAT进行建模,然后再执行其应做的任何事情-例如分类,回归等。
您还可以将相关性视为一项功能,该功能应作为神经网络描述的一部分,因为它是数据的属性。关联的性质并不是很重要,除非它不应该成为数据的一部分。这实际上是一个不同的主题-您应该对输入中的噪声进行建模或量化,并加以考虑。
因此,总之不。关联数据意味着您应该更加努力地使数据的处理在技术上更简单,更有效。过度拟合可能发生,但不会发生,因为存在相关数据。