Answers:
[警告:作为ISBA的客观贝叶斯部分的持卡人,我的观点并不代表所有贝叶斯统计学家!相反,...
总而言之,没有“真正没有信息”的先验。
实际上,可悲的是,“无信息的”先例是错误的称呼。任何先前的发行版本都包含一些类似于某些信息的规范。甚至(或特别是)统一的先验。实际上,统一先验仅对于问题的一个给定参数化是平坦的。如果一个更改为另一个参数化(甚至是有界的),则变量的雅可比式更改会出现在图像和密度中,并且先验值不再是平坦的。
正如猫王指出的那样,最大熵是提倡选择所谓“非信息”先验的一种方法。但是,它需要(a)关于先验分布某些时刻的足够信息,以指定约束导致MaxEnt先于 和(b)参考度量的初步选择在连续设置中),这一选择使辩论回到了初始阶段!(此外,约束的参数化(即选择π (⋅ )∫ Θ ħ (θ )
何塞·贝尔纳多(JoséBernardo)提出了参考先验的原始理论,他选择先验理论是为了通过最大化先验和后验之间的Kullback距离来最大化数据带来的信息。在没有干扰参数的最简单情况下,解决方案是Jeffreys的优先选择。在更复杂的问题中,(a)必须选择感兴趣的参数(甚至对其感兴趣顺序进行排名);(b)先验的计算相当复杂,并且需要一系列嵌入式紧凑集,以避免不当问题。(有关详细信息,请参见例如贝叶斯选择。)
有趣的是,贝叶斯视野之外的一些研究人员一直在开发一种称为置信度分布的程序,该程序是参数空间上的概率分布,是通过从基于频率的过程中进行反演而构建的,而没有明确的先验结构,甚至没有对该参数空间的主导度量。他们认为,缺少明确的先验是一个加号,尽管结果肯定取决于基于频率的初始化程序的选择
简而言之,对于“该”“非信息性”先验没有“最佳”(甚至“更好”)的选择。我认为这是应该的,因为贝叶斯分析的本质意味着先验分布的选择很重要。而且没有先验的比较:一个不能比另一个“更好”。(至少在观察数据之前:一旦观察到,先验比较就成为模型的选择。)若泽·贝纳多,吉姆·伯杰,孙东初和许多其他“客观”贝叶斯主义者的结论是,可以存在大致相等的参考先验在不确定某人的先验信息或寻求基准贝叶斯推断时使用,其中一些先验部分地受到信息论证的支持,
正式的非信息先验的吸引人的性质是“频繁者匹配性质”:这意味着后继者的95%可信度间隔也(至少近似)为频繁者意义上的95%置信度间隔。该属性仅供Bernardo参考先验,尽管这些非信息先验的资金并不以实现良好的频繁匹配性为导向,但是,如果您使用“天真”(“平坦”)非信息先验,例如均匀分布或高斯分布分布具有很大的方差,那么就不能保证频繁匹配属性成立。也许贝尔纳多的参考先验不能被认为是非信息先验的“最佳”选择,但可以被认为是最成功的先验选择。
Jeffreys分布还存在不一致的问题:超过或超过变量的Jeffreys先验是不合适的,对于概率参数的Jeffreys而言并非如此:在具有的质量。
仁义表明,非信息分布必须与不适当的积分相关。请改为参阅Lhoste的分布,该分布避免了这一困难并且在变量的变化下保持不变(例如,对于,度量为)。
首先,翻译好!
致E. LHOSTE:“炮弹精品”,《炮弹评论》,第91号书,1923年1月4日
致A. RENYI:“关于新的公理概率论”,《数学学报》,Académiedes Sciences hongroises,tome VI,fasc.3-4,1955年
我可以加上:M. DUMAS:“先验地证明我们的身份”,《武器科学与技术》,第56卷,第4期,1982年,第687-715页
我同意西安市的出色回答,他指出,就没有信息的意义而言,没有任何先验是“无信息的”。为了扩展这个主题,我想指出一种替代方法是在不精确的概率框架内进行贝叶斯分析(参见esp。Walley 1991,Walley 2000)。在此框架内,先验信念由一组概率分布表示,这会导致相应的后验分布。听起来可能没有多大帮助,但实际上确实很棒。即使使用非常广泛的先验分布(某些时刻可以在所有可能的值范围内),您仍然经常将后验收敛为到单个后验。
Walley将这种分析框架公认为其自身的概率分析的特殊形式,但从本质上讲,它等效于使用一组先验的稳健贝叶斯分析,从而产生了相应的后验集合。在许多模型中,可以设置“非信息性”先验集合,该先验集合允许某些矩(例如,先验均值)在整个可能的值范围内变化,尽管如此,仍会产生有价值的后验结果,后验矩是有界的更紧密地。至少在能够在其整个允许范围内变化的力矩方面,这种分析形式可以说是更好的主张,称为“非情报”。
一个简单的例子-Bernoulli模型:假设我们观察到数据其中是感兴趣的未知参数。通常,我们将使用beta密度作为先验(Jeffrey先验和参考先验都是这种形式)。我们可以根据先验均值和另一个参数来指定这种先验密度形式为:
(这种形式给出了先前的时刻和。)现在,在一个不精确的模型中,我们可以将先验值设置为由所有可能的期望值上的所有这些先验分布的集合组成,但固定了其他参数以控制平均值范围内的精度。例如,我们可以使用一组先验:
假设我们在数据中观察到正指标。然后,使用伯努利-β模型的更新规则,相应的后验集合为:
后验期望的可能值范围是:
在这里重要的是,即使我们从关于参数的期望值(先前的期望值覆盖所有可能值)的模型“不具信息性”开始,我们仍然得到关于信息的后验推断到参数的后验期望(现在它们的范围覆盖更窄的值)。当该值范围被压缩到单个点,这是的真实值。