学生t分布参数的最大似然估计是什么?它们是否以封闭形式存在?快速的Google搜索没有给我任何结果。
今天,我对单变量情况很感兴趣,但是可能我将不得不将模型扩展到多个维度。
编辑:我实际上对位置和比例参数最感兴趣。现在,我可以假设自由度参数是固定的,并且可能以后使用某种数字方案来找到最佳值。
学生t分布参数的最大似然估计是什么?它们是否以封闭形式存在?快速的Google搜索没有给我任何结果。
今天,我对单变量情况很感兴趣,但是可能我将不得不将模型扩展到多个维度。
编辑:我实际上对位置和比例参数最感兴趣。现在,我可以假设自由度参数是固定的,并且可能以后使用某种数字方案来找到最佳值。
Answers:
对于T,不存在闭合形式,但是通过EM算法,这是一种非常直观且稳定的方法。现在,由于学生是法线的比例混合,因此您可以将模型编写为
其中和瓦特我〜ģ 一个(ν。这意味着,有条件上W¯¯我的MLE只是加权平均值和标准偏差。这是“ M”步骤
σ 2=Σ我瓦特我(ÿ我 - μ)2
现在,“ E”步骤用给定所有数据的期望值替换。给出为:
因此,您只需重复上述两个步骤,就可以用当前参数估计值替换每个方程式的“右侧”。
这很容易地示出了如与大残差观测接收在计算为位置更少重量t分布的稳健性特性,和有界的影响在计算σ 2。通过“有限影响”的意思是所述估计的贡献σ 2从第i个观测不能超过给定阈值(这是(ν + 1 )σ 2 ö 升d在EM算法)。另外,ν是“健壮性”参数,因为增加(减小)ν将导致更多(更少)均匀的权重,因此对异常值具有更高(更少)的敏感性。
需要注意的一件事是,对数似然函数可能具有多个固定点,因此EM算法可能会收敛到局部模式而不是全局模式。当location参数开始时离离群值太近时,很可能会找到本地模式。因此,从中位数开始是避免这种情况的好方法。
以下论文完全解决了您发布的问题。
Liu C.和Rubin DB1995。“使用EM及其扩展ECM和ECME对t分布进行ML估计。” 中国统计月刊5:19–39。
无论有无自由度知识,它都能提供通用的多元t分布参数估计。该过程可以在第4节中找到,它与一维概率概率逻辑非常相似。
I have recently discovered a closed-form estimator for the scale of the Student's t distribution. To the best of my knowledge, this is a new contribution, but I would welcome comments suggesting any related results. The paper describes the method in the context of a family of "coupled exponential" distributions. The Student's t is referred to as the Coupled Gaussian, where the coupling term is the reciprocal of the degree of freedom. The closed-form statistic is the geometric mean of the samples. Assuming a value of the coupling or degree of freedom, an estimate of the scale is determined by multiplying the geometric mean of the samples by a function involving the coupling and a harmonic number.
https://arxiv.org/abs/1804.03989 Use of the geometric mean as a statistic for the scale of the coupled Gaussian distributions, Kenric P. Nelson, Mark A. Kon, Sabir R. Umarov