我听说过Jaynes声称常客使用“隐式先验”的想法。
这些隐式先验是什么?这是否意味着常客模型是否正在等待所有贝叶斯模型的特例?
我听说过Jaynes声称常客使用“隐式先验”的想法。
这些隐式先验是什么?这是否意味着常客模型是否正在等待所有贝叶斯模型的特例?
Answers:
在常客主义决策理论中,存在完整的类结果,这些类结果将可接受的过程表征为贝叶斯过程或贝叶斯过程的极限。例如,斯坦因的充要条件(Stein。1955; Farrell,1968b)指出,在以下假设下
估计量仅在存在的情况下才是可接受的
与相关的贝叶斯估计量的序列,使得π Ñ
[摘自我的书《贝叶斯选择》,定理8.3.0,第407页]
在这种受限意义上,可容许性的频繁性具有贝叶斯背景,因此将隐式先验(或其顺序)与每个可容许估计量相关联。
旁注:不幸的是,查尔斯·斯坦因于11月25日在加利福尼亚州帕洛阿尔托去世。他是96岁。
没有为不变或同变估计类似(如果数学参与)结果,即在最优同估计是贝叶斯估计作用于一个统计模型中的每个传递组,用正确的哈尔措施相关联,,诱发上由该组和对应的不变损失。有关详细信息,请参阅Pitman(1939),Stein(1964)或Zidek(1969)。这是贾恩斯(Jaynes)牢记的关于不变性原则解决边缘化悖论的最有可能的想法。 Θ
此外,正如Civilstat回答中详述的那样,另一种频繁出现的最优性概念(即最小极大)也与贝叶斯过程相关联,因为最小化最大误差(在参数空间上)的最小极大值过程通常是最大化最小误差( (所有先前的分布),因此是一个贝叶斯或贝叶斯限制程序。
问:我可以用来将贝叶斯直觉转换为常客模式的简单方法吗?
首先,我将避免使用术语“频率模型”,因为存在采样模型(数据是参数值的实现)X 〜˚F (X | θ )θ 和频率过程(最佳无偏估计量,最小值方差置信区间&tc。)95 95其次,我认为没有考虑将频频方法视为边界方法或限制贝叶斯方法的令人信服的方法论或理论理由。存在频繁程序的理由是要在采样空间(即重复观察)中满足某些最优性。给定先验分布并从采样模型中获得一个实现,贝叶斯过程的主要理由是[在特定标准或损失函数下]是最佳的。有时,生成的过程满足某些常客性(%的可信区域是%的置信区域),但这是偶然的,因为这种最优性并未转移到与贝叶斯模型相关的所有过程。
@西安的答案更完整。但是,由于您还要求外卖,这是一个。(我提到的概念与上面的可接纳性设置并不完全相同。)
经常(但并非总是)喜欢使用“最小极大值”的估计量:如果我要估计,则我的估计量的最坏情况风险应该比其他任何估计量的最坏情况风险都要好。 。事实证明,MLE通常(近似)为minimax。在此处或此处查看详细信息。θ
为了找到问题的极小极大估计量,一种方法是考虑贝叶斯片刻,然后找到“最不利先验”。这是其先验者的贝叶斯估计量具有比其他先验者的贝叶斯估计量更高的平均风险。如果找到它,那么的Bayes估计量就是minimax。π
从这个意义上讲,您可能会讨厌地说:一个(使用极小极大限度的)频繁者就像一个贝叶斯人,他选择了(最差点)基于最不利的先验。
也许您可以这样说:这样的频率主义者是保守的贝叶斯主义者,选择的不是主观先验甚至是无信息先验,而是(在此特定意义上)选择最坏情况的先验。
最后,就像其他人所说的那样,用这种方式比较常客和贝叶斯主义者是很困难的。成为常客不一定意味着您使用某种估计量。这只是意味着您要问有关估计量的采样属性的问题,而这些问题并不是贝叶斯算法的头等大事。(因此,任何希望获得良好采样属性的贝叶斯主义者(例如“校准贝叶斯”)也都是频率论者。)
即使您将频率论者定义为其估计量始终具有最佳采样属性的人,也有许多这样的属性,并且您不能总是一次见到他们。因此,一般来讲“所有频率模型”都很难说。