假设是观察到的数据,假定该数据是一系列iid随机变量的实现,该变量具有关于sigma有限度量定义的公共概率密度函数。密度称为数据生成过程(DGP)密度。y1,…,ynY1,…,Ynpeνpe
在研究者的概率模型
是由参数向量θ索引的概率密度函数的集合
。假设M中的每个密度是相对于共同的sigma有限度量ν定义的(例如,每个密度可以是具有相同样本空间S的概率质量函数)。M≡{p(y;θ):θ∈Θ}θMνS
重要的是要保持实际生成数据的密度pe在概念上与数据的概率模型不同。在经典的统计方法中,对这些概念的仔细区分要么被忽略,要么没有做出,或者从一开始就假设正确地指定了概率模型。
甲正确指定模型M相对于pe是其中定义为模型pe∈M ν -almost无处不在。当
相对于p e错误指定M,这对应于未正确指定概率模型的情况。pe
如果正确指定的概率模型,则存在一个θ∗在参数空间Θ,使得
pe(y)=p(y;θ∗) ν -almost无处不在。这样的参数向量被称为“真实参数向量”。如果概率模型指定不正确,则不存在真实的参数向量。
内White的模型假设错误框架的目标是找到参数估计θ Ñ最小化
ℓ Ñ(θ)≡ (1 / Ñ )Σ ñ 我= 1个日志p (ÿ 我 ; θ)超过一些紧凑参数空间Θ。假设一个独特的严格全局极小,θ *,预期值的ℓ ň上Θ位于内部Θθ^nℓ^n(θ)≡(1/n)∑ni=1logp(yi;θ)Θθ∗ℓ^nΘΘ。在正确指定概率模型的幸运情况下,θ∗可解释为“真实参数值”。
另外,在概率模型正确指定的特殊情况下,则θ Ñ是大家熟悉的最大似然估计。如果我们不知道有绝对的知识概率模型正确指定,那么θ ñ被称为准最大似然估计和目标是估计θ *。如果我们很幸运并且正确地指定了概率模型,则准最大似然估计会在特殊情况下减少到熟悉的最大似然估计,并且
θ ∗成为真实的参数值。θ^nθ^nθ∗θ∗
White(1982)框架内的一致性对应于θ∗收敛,而无需θ∗一定是真实的参数向量。在怀特的框架内,我们永远不会估计由δ产生的集合包括TRUE分布P *的事件的概率。取而代之的是,我们总是估计概率分布P **,这是由δ产生的集合包括密度p(y;θ∗)指定的分布的事件的概率
。
最后,关于模型错误指定的一些评论。很容易找到示例,其中错误指定的模型非常有用且非常可预测。例如,考虑具有高斯残差项的非线性(甚至线性)回归模型,该项的方差非常小,而环境中的实际残差不是高斯项。
在正确指定的模型无用且无法预测的情况下,也很容易找到示例。例如,考虑一个用于预测股票价格的随机游动模型,该模型预测明天的收盘价是今天的收盘价与一些具有极大方差的高斯噪声的加权和。
模型错误指定框架的目的不是为了确保模型的有效性,而是为了确保可靠性。也就是说,即使存在少量或大量的模型错误指定,也要确保正确估计与参数估计,置信区间,假设检验等相关的采样误差。拟最大似然估计值是通过协方差矩阵估计器以θ∗为中心渐近法线的,该协方差矩阵估计器取决于对数似然函数的一阶和二阶导数。在特殊情况下,如果您很幸运并且模型正确,那么所有公式都将简化为大家熟悉的经典统计框架,其目标是估计“真实”参数值。