雅可比因子导致的不同概率密度变换


12

在Bishop的模式识别和机器学习中,在引入概率密度之后,我读了以下内容:p(x(a,b))=abp(x)dx

在变量的非线性变化下,由于雅可比因子,概率密度与简单函数的变换不同。例如,如果我们考虑变量,则函数变为 。现在考虑 相对于新变量对应于密度的概率密度,其中满足表示和是不同密度的事实。观测落在范围将用于的小值 ,被变换成的范围内x=g(y)f(x)f~(y)=f(g(y))px(x)py(y)ypx(x)py(y)(x,x+δx)δx(y,y+δy),其中 px(x)δxpy(y)δy,因此py(y)=px(x)|dxdy|=px(g(y))|g(y)|

雅可比因子是什么?所有事物的确切含义(可能是定性)是什么?Bishop说,此属性的结果是,概率密度最大值的概念取决于变量的选择。这是什么意思?

对我来说,这有点出乎意料(考虑在介绍章节中)。我会感谢一些提示,谢谢!


3
“对变换后的变量的密度进行直观的解释”可能会有所帮助。关于“雅各布”,请搜索我们的网站
ub

1
有关雅可比因子的详细说明,请参阅可汗学院关于雅可比行列式的视频教程。khanacademy.org/math/multivariable-calculus/…–
JStrahl

Answers:


8

我建议您阅读问题1.4的解决方案,它提供了很好的直觉。

简而言之,如果您有一个任意函数以及两个变量和,它们通过函数相互关联,则可以通过直接分析来找到函数的最大值:或经变换的函数:。毫不奇怪,和将彼此相关,因为(这里我假设。f(x)xyx=g(y)f(x)x^=argmaxx(f(x))f(g(y))y^=argmaxy(f(g(y))x^y^x^=g(y^)y:g(y)0)

概率分布不是这种情况。如果您具有概率分布和两个随机变量,它们之间的相互关系为。那么和之间没有直接关系。这是由于Jacobian因子而发生的,Jacobian因子显示了如何通过类的函数相对地改变体积。px(x)x=g(y)x^=argmaxx(px(x))y^=argmaxy(py(y))g(.)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.