机器学习社区是否在滥用“以……为条件”和“以……为参数”?


13

假设取决于。严格来说,αXα

  • 如果和都是随机变量,我们可以写 ;α p X | α Xαp(Xα)

  • 但是,如果是一个随机变量,是一个参数,我们必须编写。α p X ; α Xαp(X;α)

我几次注意到机器学习社区似乎忽略了差异并滥用了这些术语。

例如,在著名的LDA模型中,是Dirichlet参数而不是随机变量。α

在此处输入图片说明

它不应该是吗?我看到很多人,包括LDA论文的原始作者,都将其写为。p θ | α p(θ;α)p(θα)


6
从数学上讲,您始终可以以常数为条件,因为这是随机变量的极限情况。从贝叶斯的观点来看,所有未知数都被视为随机变量,因此在整个范围内使用条件表示法是有意义的。
西安

1
@西安我了解您对“以常数为条件”的观点。但是假设我从参数的分类分布中得出,即。我可以将分布写为吗?这对我来说很奇怪,因为总是可以设置一个固定的。在我看来更舒服。θ X Ç θ p X | θ θ p X ; θ XθXCat(θ)p(Xθ)θp(X;θ)
Sibbs赌博

4
我在这种特殊情况下看不到写的问题。再一次,使用条件符号为在每个未知参数上引入先验分布铺平了道路。p(Xθ)
西安

Answers:


14

我认为这更多的是关于贝叶斯/非贝叶斯统计,而不是机器学习与统计。

X,αp(Xα)Xαααp(X;α)p(Xα)p(α)ααα

p(X;α)p(Xα)p

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.