样本量很小的回归


9

我想使用4到5个解释变量进行回归,但是我只有15个观察值。无法假设这些变量是正态分布的,是否存在非参数或任何其他有效的回归方法?


5
没有假设任何解释变量是正常的。也没有关于响应的边际分布的假设。如果您正在进行CI或假设检验,则通常的推论假定响应的条件正常。更重要的是线性和恒定方差的假设。您的回应包括什么(/为什么不正常)?
Glen_b-恢复莫妮卡2014年

3
否。您没有足够的数据。这是探索性分析。您可能会看到暗示性关系。但是您应该避免使用p值,置信区间和假设检验。
查尔斯

Answers:


10

@Glen_b关于回归1中的正态性假设的性质是正确的。

我认为您更大的问题将是您没有足够的数据来支持4到5个解释变量。经验法则2的标准规则是,每个解释变量至少应有10个数据,在您的情况下应为40或50个数据(这是对假设没有任何疑问的理想情况)。因为您的模型不会完全饱和3(您要获得的数据多于要拟合的参数),可以获得参数(斜率等)估计值,并且在理想情况下,估计值是渐近无偏的。但是,您的估计很可能与真实值相差很远,并且SE / CI很大,因此您将没有统计能力。请注意,使用非参数或其他替代方法,回归分析不会使您摆脱这个问题。

您需要做的是根据您领域中的现有理论或直觉来选择一个解释变量(在查看数据之前!),或者您应该合并您的解释变量。后一种选择的合理策略是运行主成分分析(PCA),并使用第一个主成分作为您的解释变量。

参考:
1 .如果残差是正态分布而Y不是,该怎么办?
2. 多元回归的最小样本量的经验法则
3. 多元回归方程式可输入的最大自变量数

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.