线性和逻辑回归的误差分布


9

对于连续数据,线性回归假设误差项分布为N(0,)Y=β1+β2X2+uσ2

1)我们是否假设Var(Y | x)同样是〜N(0,)?σ2

2)Logistic回归中的这种误差分布是什么?当数据为每种情况下1条记录的形式,其中“ Y”为1或0时,误差项为分布的Bernoulli(即方差为p(1-p)),并且数据的形式为#从#次试验中获得成功,是否假设是二项式的(即方差为np(1-p)),其中p是Y为1的概率?


2
您不是很精确,模型假设是误差项是独立的并且以N(0,σ2),并且与COVARIATE无关。什么是Var(Y | x)?您是否以X为条件2= x?模型是否假设协变量在某种程度上是随机的,或者我们假设协变量根据设计矩阵是固定的?我认为是后者,因此Var(Y | X2= x)是假设所隐含的,不需要假设。
Michael R. Chernick 2012年

@MichaelChernick模型为何假设 X2是固定的?这当然可以是它固定的情况下,但它也可以是随机的。这个问题对我来说都没有暗示。
彼得·弗洛姆

@PeterFlom我读到一个问题,即假设误差分布的线性回归意味着OLS确实需要X2是固定的和已知的。如果某人具有Deming回归(即变量回归中的错误),则会在问题中指定。看看Stat给出的答案,表明他也以同样的方式回答了这个问题。
Michael R. Chernick 2012年

@迈克尔,我是假设固定X.
B_Miner

Answers:


10

1)如果 u 具有正态分布,即 N(0,σ2)则,因为不是随机变量。Var(Y|X2)=Var(β1+β2X2)+Var(u)=0+σ2=σ2β1+β2X2

2)在逻辑回归,假设错误遵循二项式分布如前所述这里。最好将其写为,因为这些概率取决于,如此或“ 应用逻辑回归”中所引用。Var(Yj|Xj)=mj.E[Yj|Xj].(1E[Yj|Xj])=mjπ(Xj).(1π(Xj))Xj


Stat,所以说第i个个体误差的方差是正确的, ei,是 pi(1-pi),这与您假设在数据中具有相同协变量模式的多个观察值(即其他情况)相同 mj对于所有j)= 1?
B_Miner 2012年

2
是的,这是正确的。如果Yi=pi+eiP(Yi=1)=1P(Yi=0)=pi, 然后 ei=1pi 很有可能 pi 要么 ei=pi 很有可能 1pi。因此ei 均值分布 0 和方差等于 p一世1个-p一世
2012年

在这里,Stat还有一个要点,我们必须假设X是固定的,对于线性和逻辑回归正确的情况,对于Var(Y | X)= Var(e)都是非随机的?
B_Miner 2012年

NB Ë一世=1个-p一世 很有可能 p一世 要么 Ë一世=-p一世 很有可能 1个-p一世不是二项分布Ë一世
Scortchi-恢复莫妮卡

B_Miner: Varÿ|X=Varÿ|X=X 表示方差 ÿ 以随机变量为条件 X正在观察值 X。因此,预测变量是通过实验固定还是在样本中观察并不重要:@Stat的说法是,出于回归的目的,它们不再被视为随机变量。
Scortchi-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.