当我在某些软件包(例如Mathematica)中执行线性回归时,我得到与模型中各个参数关联的p值。例如,产生结果的线性回归的结果将具有与a关联的p值,以及与b关联的p值。
这些p值对这些参数分别意味着什么?
有没有一种通用方法可以为任何回归模型计算参数?
是否可以将与每个参数关联的p值组合为整个模型的p值?
为了使这个问题本质上保持数学性质,我仅在概率方面寻求对p值的解释。
当我在某些软件包(例如Mathematica)中执行线性回归时,我得到与模型中各个参数关联的p值。例如,产生结果的线性回归的结果将具有与a关联的p值,以及与b关联的p值。
这些p值对这些参数分别意味着什么?
有没有一种通用方法可以为任何回归模型计算参数?
是否可以将与每个参数关联的p值组合为整个模型的p值?
为了使这个问题本质上保持数学性质,我仅在概率方面寻求对p值的解释。
Answers:
用于p值是在假设“的检验的p值α = 0 ”(通常是一个2面吨 -test)。用于p值b是在假设“的检验的p值β = 0 ”(也通常是双面吨 -test)且同样在回归任何其他系数。这些检验的概率模型由线性回归模型中假定的模型确定。对于最小二乘线性回归,该对(a ,b)遵循以真实参数值(α为中心的二元正态分布),针对每个系数的假设检验等效于检验- 基于适当的正态分布(一个变量,即a或b的单独分布)的样本,检验α = 0(分别为β = 0)。其中正态分布出现有些复杂,并且涉及“自由度”和“帽子矩阵”的细节(基于符号甲一些经常出现在OLS回归的理论的矩阵)。
是。通常通过最大似然估计来完成(并定义)。对于OLS线性回归和少量其他模型,有一些精确的公式可以根据数据估算参数。对于更一般的回归,解决方案本质上是迭代的和数值的。
不直接。p值是为整个模型的检验而单独计算的,也就是说,对于假设所有变量(假设变量实际上都在变化,因此不包括“常数项”的系数)的假设的检验,一)。但是,通常不能从系数的p值的知识中计算出该p值。
关于您的第一个问题:这取决于您选择的软件。在这些情况下,确实有两种类型的p值经常使用,它们通常都是基于似然比检验(虽然还有其他方法,但这些结果通常是相同的或至少相差很小)。
重要的是要意识到所有这些p值都以其余参数(的一部分为条件)为条件。这意味着:假设(某些)其他参数估计正确,您将测试参数的系数是否为零。通常,这些检验的零假设是系数为零,因此,如果您的p值较小,则意味着(有条件地根据其他系数的值)系数本身不太可能为零。
I型测试根据模型中从左到右的系数值有条件地测试每个系数的零度。III型测试(边际测试),以所有其他系数的值为条件,测试每个系数的零度。
尽管通常您可以同时获得两种方法,但不同的工具会默认使用不同的p值。如果您没有统计之外的理由可以按一定顺序包含参数,则通常会对III型测试结果感兴趣。
最后(与您的最后一个问题更多相关),使用似然比检验,您始终可以针对以其余条件为条件的任何系数集创建检验。如果要同时测试多个系数为零的情况,这是一种方法(否则您会遇到一些令人讨厌的多重测试问题)。