我正在使用贝叶斯解决聚类问题。经过一些计算,我最终需要获得两个概率的比率:
以获得。这些概率是通过将两个不同的2D多元KDE集成而获得的,如以下答案所示:
其中和是KDE,并且对低于阈值和。两个KDE都使用高斯内核。可以在这里看到与我正在使用的KDE类似的KDE代表性图像:在2D中集成内核密度估计器。
我通过stats.gaussian_kde python
函数来计算KDE,因此我假设它具有以下一般形式:
n
我的点阵列的长度在哪里,h
使用的带宽是多少。
上面的积分是使用蒙特卡洛过程计算的,该过程在计算上非常昂贵。我已经读过某处(忘了在哪里,对不起),在这种情况下,可以用在阈值点评估的PDF(KDE)比率替换概率比率,以获得同样有效的结果。我对此感兴趣,因为计算KDEs的比率要比计算MC积分的比率要快几个数量级。
因此问题被简化为该表达式的有效性:
在什么情况下(如果有的话)我可以说这种关系是正确的?
[固定错字(编辑)]
添加:
这基本上是相同的问题,但以更数学的形式提出。
P(X)
我要避免计算的值。您能否扩大该参数的相关性?