如果将非线性函数拟合到一组点(假设每个横坐标只有一个纵坐标),则结果可以是:
- 残差很小的非常复杂的函数
- 具有大量残差的非常简单的函数
交叉验证通常用于在这两个极端之间找到“最佳”折衷方案。但是“最佳”是什么意思?是“最有可能”吗?您甚至将如何证明最可能的解决方案是什么?
我内心的声音告诉我,简历正在寻找某种最低限度的能源解决方案。这让我想到了熵,我隐约知道它在统计和物理学中都会发生。
在我看来,“最佳”拟合是通过最小化复杂度和误差函数的总和而产生的,即
minimising m where m = c(Complexity) + e(Error)
这有意义吗?函数c和e是什么?
请您能用非数学语言来解释,因为我对数学不太了解。