简单解释一下插值的含义。它与回归的概念有什么关系?
插值法是一种在表的各行之间阅读的技巧,在基本数学中,该术语通常表示从该函数的一组给定值或表格值中计算出函数中间值的过程。
我不能回答第二个问题。请帮忙
简单解释一下插值的含义。它与回归的概念有什么关系?
插值法是一种在表的各行之间阅读的技巧,在基本数学中,该术语通常表示从该函数的一组给定值或表格值中计算出函数中间值的过程。
我不能回答第二个问题。请帮忙
Answers:
插值法和回归法之间的主要区别在于它们要解决的问题的定义。
给定数据点,进行插值时,您会寻找某种预定义形式的函数,该函数中的点中的值与指定的值完全相同。这意味着给定的对(X 我,ÿ 我)你寻找˚F一些预定义的形式下,其满足˚F (X 我)= ÿ 我。我认为最常将F选择为多项式,样条曲线(在给定点之间的间隔上的低次多项式)。
进行回归时,您会寻找一个使某些成本(通常是误差平方和)最小化的函数。您不需要功能在给定点具有确切的值,您只需要一个很好的近似值即可。在一般情况下,你的发现功能可能无法满足˚F (X 我)= ÿ 我的任何数据点,但成本函数,即Σ Ñ 我= 1(˚F (X 我)- Ÿ 我)2将是可能的最小给定形式的所有功能。
一个很好的例子说明为什么您可能只想近似而不是插值的是股市价格。您可以以最近的时间单位为单位获取价格,并尝试对它们进行插值以对下一个时间单位的价格进行一些预测。这是一个坏主意,因为没有理由认为价格之间的关系可以由多项式精确表示。但是线性回归可能会成功,因为价格可能会有一些“斜率”,并且线性函数可能是一个很好的近似值,至少在本地是这样(提示:这并不容易,但是在这种情况下,回归绝对比插值更好) )。
前面的两个答案已经解释了线性插值和线性回归(甚至一般插值和多项式回归)之间的关系。但是重要的联系是,一旦拟合了回归模型,就可以使用它在给定的数据点之间进行插值。
b / w的基本差异插值和回归如下:插值:假设有n个点(例如:10个数据点),在插值中,我们将通过所有数据点(即此处的10个数据点)的曲线拟合为多项式的阶数(数据点数-1;即这里是9)
通常,如果内插和回归的阶数大于3,则其阶数将为(1,2或3),在曲线中会看到更多的振荡。
回归是找到最佳拟合线的过程[1]。插值是使用最佳拟合线从另一个变量的值估计一个变量的值的过程,只要您使用的值在数据范围内即可。如果超出范围,则将使用Extrapolation [1]。
[1] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regression.html
通过插值或样条拟合,我们得到的是较大尺寸的数字数据(在每对原始数据之间插值),在绘制时会产生平滑曲线的效果。实际上,在每对原始数据之间拟合了一个不同的多项式,因此插值后的整个曲线是逐段连续的曲线,其中每段由不同的多项式形成。
如果要寻找原始数值数据的参数表示形式,则必须进行回归。您也可以尝试将高次多项式拟合到样条曲线。无论如何,表示将是近似值。您还可以检查近似值的准确性。
对于另一个变量(X)的给定值,回归和内插都可用于预测变量(Y)的值。在回归中,即使给定值(X)不在列表值的范围内,我们也可以预测因变量(Y)的任何值。但是在插值的情况下,我们只能预测因变量的值(Y)为自变量(X)的值,该值在X的给定值范围内。
插值是将x = a和x = b之间的许多点精确拟合到插值多项式的过程。插值可用于在域x = [a,b]中找到y的近似值(或缺失值),其准确性高于回归技术。
另一方面,回归是将许多点拟合到通过或接近点的曲线的平方误差最小的过程。回归将不会像插值一样精确地估计x = [a,b]域中y的值,但是对于x =(-infinity,a)和x =( b,+无穷大)。
总而言之,插值可在已知x范围的域内提供更好的y值准确度,而回归可在已知x范围以下和范围之外的域提供更好的y预测。