参数与潜在变量


13

我以前曾问过这个问题,并且一直在努力确定什么使模型参数以及什么使它成为潜在变量。因此,在本站点上有关该主题的各种主题中,主要区别似乎是:

不会观察到潜在变量,但它们具有相关的概率分布,因为它们是变量,也未观察到参数,也没有与它们相关的分布,据我所知,这些变量是常数,并且具有固定但未知的值,我们正在尝试找。同样,我们可以对参数进行先验表示,以表示我们对这些参数的不确定性,即使只有一个真实值与它们相关联,或者至少是我们所假设的。我希望到目前为止我是对的吗?

现在,我一直在从期刊论文中查看贝叶斯加权线性回归的示例,并且确实在努力理解什么是参数和什么是变量:

yi=βTxi+ϵyi

这里观察到和,但是只有被视为变量,即具有与之关联的分布。ÿ ÿxyy

现在,建模假设为:

yN(βTxi,σ2/wi)

因此,的方差被加权。y

和上也有一个先验分布,分别是正态分布和gamma分布。 w ^βw

因此,完整的对数可能性由下式给出:

logp(y,w,β|x)=ΣlogP(yi|w,β,xi)+logP(β)+ΣlogP(wi)

现在,据我了解,和都是模型参数。但是,在本文中,他们一直将它们称为潜在变量。我的推论是和都是变量的概率分布的一部分,它们都是模型参数。但是,作者将它们视为潜在的随机变量。那是对的吗?如果是这样,模型参数是什么?w ^ β w ^ ÿβwβwy

可以在这里找到该论文(http://www.jting.net/pubs/2007/ting-ICRA2007.pdf)。

本文是Ting等人的《自动离群值检测:贝叶斯方法》。


2
列出论文的引用可能会有所帮助(也许还有一个链接)。问题的一部分是,这些与频率论和贝叶斯论的观点完全不同。从贝叶斯角度看,参数确实具有分布-它不仅仅是为了表示不确定性而添加的东西。
gung-恢复莫妮卡

我认为这将是不公平的,因为人们会认为我希望他们在不解释任何内容的情况下阅读该论文,但我现在已经提出了。

为什么不能将先验值放在潜在变量上?我是贝叶斯新手,但看来您应该能够做到。
robin.datadrivers

我认为当然可以,而且必须使用贝叶斯设置。但是,我不确定为什么或是此设置中的变量。对我来说,它们看起来像模型的参数。我很难说出在此设置中使成为变量而不是参数的原因。我也是一个新手,您可以清楚地看到……β w ^wβw

2
谢谢,@ Luca。如果您要求人们阅读本文,那不是很好,但是在上下文中保留它是很好的。我认为您做对了。
gung-恢复莫妮卡

Answers:


6

在本文中,通常,(随机)变量是从概率分布中提取的所有内容。变量(随机变量)是您没有直接观察到的变量(观察到,未观察到,但都是rv)。从一个潜在的随机变量中,您可以得到一个后验分布,它是根据观测数据而定的概率分布。yβ

另一方面,即使您不知道参数的值,参数也是固定的。例如,最大似然估计可为您提供最可能的参数值。但这给了你一点,而不是完整的分布,因为固定的东西没有分布!(您可以分配一个值来确定您对这个值的确定程度,或该值在什么范围内,但这与值本身的分布不同,后者仅在该值实际上是随机值时才存在变量)

在贝叶斯设置中,您可以全部使用。在这里,参数就是簇数之类的东西。您将此值提供给模型,模型将其视为固定数字。是随机变量,因为它是从分布中得出的,而和是潜在随机变量,因为它们也是从概率分布中得出的。这一事实取决于和也不会让他们“参数”,它只是让取决于两个随机变量。yβwyβwy

在本文中,他们认为和是随机变量。βw

在这句话中:

这些更新方程需要迭代运行,直到所有参数和完整的对数似然收敛到稳定值为止

从理论上讲,他们谈论的是两个参数,而不是随机变量,因为在EM中,这就是您要对参数进行优化的方法。


问题是关于潜在变量。
蒂姆

固定,希望现在更清楚。
alberto
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.