当您感到困惑时,让我先说明问题,然后逐一回答您的问题。您的样本大小为10,000,每个样本由特征向量。如果要使用高斯径向基函数执行回归,则寻找形式为其中是您的基本函数。具体来说,您需要找到权重以便对于给定的参数和可以将与相应预测 =之间的误差最小化x∈R31
f(x)=∑jwj∗gj(x;μj,σj),j=1..m
gimwjμjσjyy^f(x^) -通常,您会最小化最小二乘误差。
Mu下标j参数到底是什么?
您需要找到基函数。(您仍然需要确定数字)每个基函数将具有一个和一个(也是未知的)。下标范围是到。mgjmμjσjj1m
是载体?μj
是的,这是。换句话说,它指向特征空间中的某个位置,并且必须为基函数中的每个确定。R31μm
我已经读到,这支配着基本函数的位置。那这不是什么意思吗?
第基函数以为中心。您将需要确定这些位置在哪里。因此,不,它不一定是任何东西的均值(但是请进一步了解确定它的方法)jthμj
现在为“治理空间尺度”的西格玛。那到底是什么
σ如果我们转向基函数本身,则更容易理解。
它有助于在较低的维数中说高斯径向基函数,例如或。在,高斯径向基函数只是众所周知的钟形曲线。铃当然可以是窄的或宽的。宽度由确定 -较大越窄的钟形。换句话说,缩放钟形的宽度。因此,对于 = 1,我们没有缩放比例。对于较大的我们有足够的缩放比例。R1R2R1σσσσσ
您可能会问这是什么目的。如果您认为铃铛覆盖了空间的某些部分(一条线)–狭窄的铃铛将仅覆盖该行的一小部分*。靠近钟形中心的点将具有较大的值。远离中心的点的值较小。缩放具有将点推到离中心更远的效果-因为钟形变窄点将位于离中心更远的位置-减小了的值R1xgj(x)gj(x)gj(x)
每个基函数将输入向量x转换为标量值
是的,您正在某个点中评估基函数。x∈R31
exp(−∥x−μj∥222∗σ2j)
结果得到标量。标量结果取决于点与中心的距离,该距离由和标量。xμj∥x−μj∥σj
我已经看到一些实现对此参数尝试使用.1,.5、2.5之类的实现。这些值如何计算?
当然,这是使用高斯径向基函数的有趣且困难的方面之一。如果您在网上搜索,则会发现许多有关如何确定这些参数的建议。我将以非常简单的方式概述基于聚类的一种可能性。您可以在线找到此建议和其他一些建议。
首先对10000个样本进行聚类(首先可以使用PCA减小维数,然后进行k均值聚类)。您可以让为找到的簇数(通常使用交叉验证来确定最佳)。现在,为每个群集创建一个径向基函数。对于每个径向基函数,令为的中心(例如均值,质心等)。让反映群集的宽度(例如,半径...)现在继续执行回归(这个简单的描述只是一个概述-每个步骤都需要大量工作!)mmgjμjσj
*当然,钟形曲线的定义是-到因此在线上的任何地方都将具有值。但是,远离中心的值可以忽略不计∞∞