不对称分布的核密度估计


10

令是从未知(但肯定是非对称的)概率分布中得出的观察结果。{X1个Xñ}

我想通过KDE方法找到概率分布: 但是,我尝试使用高斯内核,但是由于它是对称的,因此性能很差。因此,尽管我不了解如何使用它们,但我已经看到一些有关Gamma和Beta内核的工作已经发布。

F^X=1个ñH一世=1个ñķX-X一世H

我的问题是:假设基础分布的支持不在区间,如何处理这种不对称情况?[01个]


4
如果密度接近对数正态(在某些特定的应用程序中会遇到很多),我只需进行转换(通过获取日志)然后执行KDE,然后将KDE转换回去(转换时需要记住雅可比行列式)估算回来)。在这种情况下,它工作得很好。
Glen_b-恢复莫妮卡

@Glen_b您对这种方法有任何参考或材料吗?(在原始变量转换后计算KDE,然后将KDE转换回去)
boscovich 2013年

并不是我所知道的-我确信它们存在,因为这是一个微不足道的想法,并且易于实现。我希望统计本科生能够得出这样的结论。实际上,它运作良好。
Glen_b-恢复莫妮卡

@glen_b谢谢。因此,如果我要在技术报告/出版物中使用它,您认为可以不提供任何参考文献吗?
boscovich 2013年

1
@guy当然有可能出现问题,尤其是在进行某些转换和某些类型的数据时。我用过的情况往往接近对数正态,那里出现的带宽变化正是您所需要的;在原始数据上,它的性能要比KDE好得多。从OP的描述来看,这听起来很相似,但是我并不是在暗示这是万灵药
Glen_b-恢复莫妮卡

Answers:


5

首先,当数据不对称时,带有对称内核的KDE也可以很好地工作。否则,实际上实际上是完全没有用的。

其次,如果您认为这会引起问题,那么您是否考虑过重新缩放数据以解决不对称问题。例如,尝试进入可能是一个好主意,因为众所周知这可以解决许多问题。日志X


如果您缩放到log(x),是否还需要考虑一个雅可比人?
DilithiumMatrix

0

嗯 您可能需要一个随位置而变化的内核宽度。

如果我正在eCDF中查看问题,则可以尝试使CDF的数字斜率与内核大小有关。

我认为,如果要进行坐标转换,则需要对起点和终点有一个很好的了解。如果您非常了解目标分布,则不需要内核逼近。


1
我很容易知道我的RV是非阴性的,但仍然想要KDE。
家伙
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.