我认为您想要的工具称为切换回归。想法是有几条回归线,每个数据点都分配给其中一条。例如,第一条回归线的等式为:
回归线
的等式为:
总共说有不同的回归线。对于任何给定的数据点,我们只能看到回归线之一。因此,必须有某种机制来确定我们为每个点看到的回归线。最简单的机制就是多项式分布。也就是说,我们看到了
Yi=α1+β1Xi+ϵi
mthYi=αm+βmXi+ϵi
Mmth概率为回归线,其中。
pm∑mpm=1
通常通过最大似然估计模型。假设分布为,则您将最大化的似然函数为:
函数是标准法线密度。您可以根据约束在参数。如果您要使用拟牛顿法解决该问题,那么这通常是一个有点奇怪的最大化问题。您不能只是将所有和从零开始,ϵN(0,σ2)
L(α,β,σ)=∑m=1Mpm1σϕ(Yi−α1−β1Xiσ)
ϕ3M+1∑mpm=1,pm≥0αβpm位于。您必须为和提供不同的起始值,以便算法可以“分开”。
1Mαβ
如果您愿意,有多种方法可以使此过程更加复杂。也许您有一个变量,您认为它会影响,即哪个变量会影响选择哪个回归。那么,你可以使用一个多项式logit函数使是的函数:
ZipmpmZi
L(α,β,σ)=∑m=1M(exp(δm+γmZi)∑m′exp(δm′+γm′Zi))1σϕ(Yi−α1−β1Xiσ)
现在有参数。实际上,有参数,因为在上需要规范化-在多项式logit上读取以进行说明。5 中号- 1 δ ,γ5M+15M−1δ,γ
使它更复杂的另一种方法是使用某种方法来选择(回归线的数量)。我在自己的作品中对这种选择非常随意,因此也许其他人可以为您指出最佳选择方式。M