Answers:
@Glen_b关于回归1中的正态性假设的性质是正确的。
我认为您更大的问题将是您没有足够的数据来支持4到5个解释变量。经验法则2的标准规则是,每个解释变量至少应有10个数据,在您的情况下应为40或50个数据(这是对假设没有任何疑问的理想情况)。因为您的模型不会完全饱和3(您要获得的数据多于要拟合的参数),可以获得参数(斜率等)估计值,并且在理想情况下,估计值是渐近无偏的。但是,您的估计很可能与真实值相差很远,并且SE / CI很大,因此您将没有统计能力。请注意,使用非参数或其他替代方法,回归分析不会使您摆脱这个问题。
您需要做的是根据您领域中的现有理论或直觉来选择一个解释变量(在查看数据之前!),或者您应该合并您的解释变量。后一种选择的合理策略是运行主成分分析(PCA),并使用第一个主成分作为您的解释变量。
参考:
1 .如果残差是正态分布而Y不是,该怎么办?
2. 多元回归的最小样本量的经验法则
3. 多元回归方程式可输入的最大自变量数