Answers:
简短的答案是,您无法就的分布得出任何结论,因为它取决于x的分布以及关系的强度和形状。更正式地,y将具有“正态混合”分布,实际上它几乎可以是任何东西。
这里有两个极端的例子来说明这一点:
实际上,由于每个分布都可以很好地近似于正态混合,因此您实际上可以获得任何分布。
我们通过对真实数据施加虚拟模型来发明误差项。误差项的分布不影响响应的分布。
我们经常假设误差是正态分布的,因此尝试构建模型,使得我们估计的残差呈正态分布。对于某些分布,这可能很困难。在这些情况下,我想您可以说响应的分布会影响误差项。
In a sense the error distribution is more closely linked to the model than to the response. This can be seen from the non-identifiability of the above equation, for if both and are unknown then adding an arbitrary vector to and subtracting it from leads to the same value of , . The assignment of an error distribution and a model equation basically says which arbitrary vectors are more plausible than others.