Answers:
如果由于某种原因你知道的截距(特别是如果它是零),你可以避免浪费方差在您的数据估算东西,你已经知道了,并在你的价值观更多的信心就必须估计。
一个稍微简化的示例是,如果您已经(从领域知识中)知道一个变量(平均)是另一个变量的倍数,并且您正在尝试查找该倍数。
考虑三级分类协变量的情况。如果一个截距,则将需要2个指示符变量。使用指标变量的常规编码,任一指标变量的系数都是与参考组相比的平均差。通过抑制截距,您将拥有3个代表分类协变量的变量,而不仅仅是2个。系数是该组的平均估计值。政治领域的一个更具体的例子是,人们可能正在研究美国的50个州。代替具有状态的拦截器和49个指示符变量,通常更优选抑制拦截并具有50个变量。
用一个具体的例子来说明@Nick Sabbe的观点。
我曾经看到一位研究人员介绍了根据树的宽度来确定树的年龄的模型。可以假设当树的年龄为零时,其有效宽度为零。因此,不需要拦截。