雅可比因子导致的不同概率密度变换
在Bishop的模式识别和机器学习中,在引入概率密度之后,我读了以下内容:p(x∈(a,b))=∫bap(x)dxp(x∈(a,b))=∫abp(x)dxp(x\in(a,b))=\int_a^bp(x)\textrm{d}x 在变量的非线性变化下,由于雅可比因子,概率密度与简单函数的变换不同。例如,如果我们考虑变量,则函数变为 。现在考虑 相对于新变量对应于密度的概率密度,其中满足表示和是不同密度的事实。观测落在范围将用于的小值 ,被变换成的范围内x=g(y)x=g(y)x = g(y)f(x)f(x)f(x)f~(y)=f(g(y))f~(y)=f(g(y))\tilde{f}(y) = f(g(y))px(x)px(x)p_x(x)py(y)py(y)p_y(y)yyypx(x)px(x)p_x(x)py(y)py(y)p_y(y)(x,x+δx)(x,x+δx)(x, x + \delta x)δxδx\delta x(y,y+δy(y,y+δy(y, y + \delta y),其中 px(x)δx≃py(y)δypx(x)δx≃py(y)δyp_x(x)\delta x \simeq p_y(y)δy,因此py(y)=px(x)|dxdy|=px(g(y))|g′(y)|py(y)=px(x)|dxdy|=px(g(y))|g′(y)|p_y(y) = p_x(x) |\frac{dx}{dy}| = p_x(g(y)) | g\prime (y) |。 雅可比因子是什么?所有事物的确切含义(可能是定性)是什么?Bishop说,此属性的结果是,概率密度最大值的概念取决于变量的选择。这是什么意思? 对我来说,这有点出乎意料(考虑在介绍章节中)。我会感谢一些提示,谢谢!