假设我们有两个点(下图:黑色圆圈),并且我们想在它们之间找到第三个点的值(十字)。实际上,我们将根据实验结果(黑点)对其进行估算。最简单的情况是画一条线然后找到该值(即线性插值)。如果我们有支持点,例如,两侧都有棕色点,我们希望从中受益并拟合非线性曲线(绿色曲线)。
问题是,将红十字标记为解决方案的统计推理是什么?为什么其他十字架(例如黄色十字架)在可能的地方没有答案?什么样的推论或(?)促使我们接受红色的?
我将基于针对这个非常简单的问题的答案来提出我的原始问题。
假设我们有两个点(下图:黑色圆圈),并且我们想在它们之间找到第三个点的值(十字)。实际上,我们将根据实验结果(黑点)对其进行估算。最简单的情况是画一条线然后找到该值(即线性插值)。如果我们有支持点,例如,两侧都有棕色点,我们希望从中受益并拟合非线性曲线(绿色曲线)。
问题是,将红十字标记为解决方案的统计推理是什么?为什么其他十字架(例如黄色十字架)在可能的地方没有答案?什么样的推论或(?)促使我们接受红色的?
我将基于针对这个非常简单的问题的答案来提出我的原始问题。
Answers:
任何形式的函数拟合,甚至是非参数函数拟合(通常对所涉及曲线的平滑度进行假设),都涉及假设,因此会产生信心飞跃。
线性插值的古老解决方案是,当您拥有的数据细粒度“足够”时(如果您看一个足够近的圆,它看起来也很平坦-只要问哥伦布)就可以“正常工作”,甚至是可行的在计算机时代之前(许多现代样条解决方案并非如此)。假设相信函数将在两点之间“以相同(即线性)事物继续”是合理的,但是没有先验的理由(除非对现有概念有所了解)。
当您具有三个(或更多)非共线点时(例如在上面添加了棕色点时),很快就会很清楚,它们之间的线性插值很快就会涉及到每个中的尖角,这通常是不希望的。那就是其他选项进入的地方。
但是,如果没有更多领域的知识,就无法确定一个解决方案比另一个解决方案要好(为此,您将不得不知道其他要点的价值,这将使该功能适合于该解决方案的目的被破坏了)。第一名)。
从好的方面来看,在“规则性条件”下(也许与您的问题更相关)(请阅读:假设:如果我们知道函数是平滑的),那么线性插值和其他流行的解决方案都可以证明是“合理的”近似值。不过:这需要假设,对于这些假设,我们通常没有统计数据。
您可以计算出最适合的直线的线性方程(例如y = 0.4554x + 0.7525),但是,只有在标记了轴的情况下,该方程才有效。但是,这不会给您确切的答案,而只是相对于其他方面最合适的答案。