统计模型符号是否有“标准”?


10

例如,在BUGS手册或Lee和Wagenmakers即将出版的书(pdf)中,以及在许多其他地方,都使用了一种表示法,在我看来,它非常灵活,因为它可以用于简洁地描述大多数统计模型。这种表示法的示例如下:

yiBinomial(pi,ni)log(pi1pi)=bibiNormal(μp,σp)

它将描述一个没有预测变量但组的分层逻辑模型。描述模型的这种方式似乎工作同样适用于描述频率论者和贝叶斯模型,例如,使这个模型描述完全贝叶斯你只需要添加对先验和。μ p σ pi=1nμpσp

在某些文章或书中是否详细描述了这种类型的模型符号/形式主义?

如果要使用此符号来编写模型,则有许多不同的处理方式,这对于结合和参考他人的全面指南非常有用。我发现人们在使用这种表示法方面存在一些差异:

  • 您如何称呼分配?例如,我看过等。N,N,Norm,Normal
  • 您如何处理索引?例如,我看过,y_ {i [j]}y_ {j | i}等。 y i [ j ] y j | 一世yijyi[j]yj|i
  • 哪些参数符号通常用于参数。例如,通常使用μ作为正态分布的均值,但是其他分布呢?(为此,我通常检查Wikipedia发行版

后续问题:此符号有名称吗?(由于缺乏更好的名字,我 在我写的博客文章中将其称为以概率分布为中心的约定 ...)

Answers:


2

Halperin,Hartley和Hoel(1965)以及Sanders和Pugh(1972)介绍了一些推荐的统计符号标准。当前的大多数注释来自于19世纪末和20世纪初由生物统计学家建立的约定(大多数约定是由Pearson和Fisher及其同事完成的)。经济学家约翰·奥尔德里奇(John Aldrich)在这里维护了早期使用符号的有用列表,并且在阿尔德里奇(Aldrich,2003)中发表了英国生物特征学派的历史记载。(如果您对此主题有进一步的查询,则奥尔德里奇可能是统计符号历史上世界上最重要的专家。)

除了这项明确的工作外,还有许多书籍介绍了该领域,并且谨慎地定义与通用约定一致的符号,并在使用时定义符号。在该领域中,有许多众所周知的惯例在文献中贯彻始终,并且统计学家即使没有阅读这些研究人员的建议,也可以通过实践熟悉这些惯例。

以分布为中心的表示法的含糊之处: “以分布为中心的”表示法的使用是整个统计文献中都使用的标准约定。但是,需要指出的是有关此表示法的一件有趣的事,就是它的实际含义有些摆动。标准约定是在这些语句的右侧读取对象,作为对概率度量的某种描述(例如,分布函数,密度函数等),然后读取关系具有“ ...具有分布...”或“ ...具有概率测度...”等含义。在这种解释下,该关系比较了两组不同的事物;左侧的对象是随机变量,右侧的对象是概率测度的描述。

但是,将右侧解释为对随机变量的引用(与分布相反),并将关系读为“ ...与...具有相同的分布”也同样有效。 。在这种解释下,该关系是比较随机变量的等价关系。左侧和右侧的对象都是随机变量,并且关系是自反的,对称的和可传递的。

这给出了两种可能(同样有效)的语句解释:

XN(μ,σ2).
  • 分布解释: “具有概率分布 ”。这种解释将后一个目标视为对正常概率测度的某种描述(例如,其密度函数,分布函数等)。XN(μ,σ2)

  • 随机变量解释: “具有与相同的概率分布”。这种解释将后一个对象当作普通随机变量。XN(μ,σ2)

每种解释都有优点和缺点。随机变量解释的优点是它使用标准符号来引用等价关系,但是其缺点是需要引用具有与它们的分布函数相似的符号的随机变量。分布解释的优点是,它对整个分布及其具有给定参数值的功能形式使用相似的符号。缺点是它使用符号的方式不是等效关系。


Aldrich,J。(2003)英国生物识别学院的语言 国际统计评论 71(1),第109-131页。

Halperin,M.,Hartley,HO和Hoel,PG(1965)推荐的统计符号和符号标准美国统计学家 ,第19卷第3期,第12-14页。

Sanders,JR和Pugh,RC(1972)建议的一套标准的统计符号和符号教育研究者 1(11),第15-16页。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.