概率符号


27

在许多书籍和论文中常用的符号和在含义上有什么区别?P(z;d,w)P(z|d,w)


13
f(x;θ)与f(x |θ)相同,仅表示θ是固定参数,函数f是x的函数。f(x,Θ)(OTOH)是一个函数族(集合)的元素,其中的元素以Θ索引。也许是一个微妙的区别,但尤其是一个重要的区别。当基于已知数据x来估计未知参数θ时;那时,θ变化并且x固定,导致“似然函数”。“ |”的用法 在统计人员中更常见,“;” 在数学家中。
jbowman 2012年

是的,jbowman是正确的。有时我们称其为给定Θ时X的密度。
Michael R. Chernick 2012年

@jbowman为什么不将其发布为答案?我唯一的问题是-他们为什么要同时使用它们,但是我认为这与上下文有关(“ |”与“ P”一起使用,而“;”与“ f ”一起使用)。
2012年

好思想,安倍;就是这样。我想f是更通用的。
jbowman 2012年

Answers:


12

我相信这是似然范式的起源(尽管我没有检查以下内容的实际历史正确性,但这是理解物联网如何发展的合理方法)。

假设在回归设置中,将有一个分布:p(Y | x,beta)这意味着:如果您知道x和beta值(以其为条件),则Y的分布。

如果要估计beta,则希望最大化似然:L(beta; y,x)= p(Y | x,beta)本质上,您现在将表达式p(Y | x,beta)视为是beta的函数,但除此之外,没有区别(对于您可以正确推导的数学正确表达式,这是必要的---尽管实际上没有人打扰)。

然后,在贝叶斯设置中,参数和其他变量之间的差异很快消失,因此您开始将两种表示法混合使用。

因此,从本质上讲:没有实际的区别:它们都表示左侧事物的条件分布,而右侧事物的条件是条件。


23

是点 x处的随机变量 X的密度,其中 θ是分布的参数。f x θ X Θ在点x θ 的联合密度,并且只有在 Θ是随机变量的情况下才有意义。f x | θ 是给定 Θ X的条件分布,同样,仅当f(x;θ)Xxθf(x,θ)XΘ(x,θ)Θf(x|θ)XΘ是随机变量。当您进一步阅读本书并了解贝叶斯分析时,这一点将变得更加清晰。Θ


Uhhhh ... 是给定θx的条件分布,即使θ不是随机变量,它也是完全有意义的。这是经典统计中的标准表示法,其中θ不是随机变量。f(x|θ)xθθθ
jbowman 2012年

恩……如果您将其解释为意味着P [Θ=θ] = 1(左Θ是随机变量,右θ是常数),那么我同意。否则我不会...对于条件分布定义的分母来说,P [Θ=θ]意味着什么?
PeterR 2012年

分母?我可以写其中˚F是不参考正态分布到贝叶斯规则。 μσ是固定的。其他人也这样做,例如ll.mit.edu/mission/communications/ist/publications/…xf(x|μ,σ)fμσ
jbowman 2012年

jbowman,那么当μ和σ是固定数(即不是随机变量)时,f(x |μ,σ)作为条件密度的定义是什么?
PeterR 2012年

1
与符号f(X | Y)关联的单词“有条件的”被定义为“在某些随机事件发生时有条件的”。如果使用它来表示其他含义,例如“给定”,例如“给定的μ和σ的(指定值)f(x)”,那么这就是f(x;μ,σ)的含义是为了。由于OP询问的是符号的含义,因此我们应该在答案中明确表示该符号。
PeterR 2012年

18

f(x;θ)f(x|θ),仅表示θ是固定参数,函数fx的函数。f(x,Θ) OTOH是一个函数族(或一组函数)的元素,其中该元素用Θ索引。也许是微妙的区别,但尤其是重要的区别。当需要根据已知数据 x估计未知参数θ时;那时 θ变化而 xxθx是固定的,导致“似然函数”。用法在统计学家中更为普遍,而;在数学家中。


1
如何口头发言?你说“给定θ的x的f”吗?f(x;θ)
stackoverflowuser2010 2014年

@ stackoverflowuser2010-是的,完全是这样。
jbowman 2014年

2
我在Coursera的一些视频中发现,斯坦福大学教授安德鲁·伍(Andrew Ng)将分号形容为“参数化”。参见:class.coursera.org/ml-005/lecture/34。因此,该示例将被称为“由theta参数化的x的f”。
stackoverflowuser2010 2014年

5
说“给定”或“有条件”与“参数化”有很大不同(通常)。我讨厌有人看到这并认为两者相等。仅当条件数量是在第一项中索引变量pdf的参数时,才说“已参数化”是适当的。对于两个变量(例如f(x; y)),使用该术语将是错误的。
ATJ

2
@MikeWilliamson-当然,请选择一种您知道所有含义的符号并坚持使用!这样一来,当您回到较早执行的操作时(例如,根据我的经验提前4个小时),就不必弄清楚使用“ |”时的含义。我同意,这很烦人,但是过了一会儿,您只是观察到该符号的第一次使用,并在纸/书的其余部分记住了该符号;无论如何,区别通常并不重要。
jbowman

9

尽管并非总是这样,但是当d w不是随机变量时(这不一定表示它们是已知的),现在通常使用)。P z | d w 表示对d w值的调节。条件化是对随机变量的操作,因此当d w不是随机变量时会使用这种表示法令人困惑(并且在悲剧中很常见)。P(z;d,w)d,wP(z|d,w)d,wd,w

@Nick Sabbe指出是观测数据y的采样分布的常用符号。一些常客会使用此表示法,但坚持认为Θ不是随机变量,这是IMO的滥用。但是他们在那里没有垄断。我也看到贝叶斯主义者也这样做,在条件语句的末尾添加了固定的超参数。p(y|X,Θ)yΘ


2
X
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.