Questions tagged «kde»

1
内核密度的解释/使用
这可能是一个幼稚的问题,但这是可行的。如果我有一组经验数据并对其拟合了核密度,然后获得了一个新的单一值,该值可能来自生成原始数据集的同一过程,那么我可以分配一个新值属于该集合的概率吗? /过程,只需从y轴上读取值即可,其中x轴上的新值与内核密度线相交并除以密度线下的面积?
13 kde 

4
包含不确定性的内核密度估计
可视化一维数据时,通常使用内核密度估计技术来考虑不正确选择的bin宽度。 当我的一维数据集具有测量不确定性时,是否有标准方法来合并此信息? 例如(如果我的理解是天真的,请原谅我)KDE将高斯分布与观测值的三角函数卷积。该高斯核在每个位置之间共享,但是可以改变高斯参数以匹配测量不确定度。有执行此操作的标准方法吗?我希望用宽内核反映不确定的值。σσ\sigma 我只是在Python中实现了此功能,但我不知道执行此操作的标准方法或函数。这种技术有什么问题吗?我确实注意到它给出了一些奇怪的图形!例如 在这种情况下,低值具有较大的不确定性,因此倾向于提供较宽的平坦内核,而KDE会过重权重低(且不确定)的值。

3
自适应核密度估计器?
谁能用自适应核密度估计器报告其经验? (有很多同义词:自适应|变量|可变宽度,KDE |直方图|插值器...) 可变核密度估计 表示“我们在样本空间的不同区域中改变核的宽度。有两种方法……”实际上更多:更多是在一定半径范围内的邻居,KNN最近邻居(通常是K),Kd树,多重网格... 当然,没有任何一种方法可以做所有事情,但是自适应方法看起来很有吸引力。 例如,参见有限元方法中的自适应2d网格的精美图片 。 我想听听对实际数据有效的/无效的,特别是在2d或3d中> = 100k分散的数据点。 添加11月2日:这是一个“笨拙的”密度(逐段x ^ 2 * y ^ 2),最近邻估计以及高斯KDE与Scott因子的关系图。虽然一(1)个示例没有证明任何内容,但它确实表明NN可以很好地适应陡峭的山丘(并且使用KD树,在2d,3d中速度很快...)

4
如何估算R中零膨胀参数的密度?
我有一个很多零的数据集,看起来像这样: set.seed(1) x <- c(rlnorm(100),rep(0,50)) hist(x,probability=TRUE,breaks = 25) 我想为其密度画一条线,但是该density()函数使用一个移动窗口来计算x的负值。 lines(density(x), col = 'grey') 有一个density(... from, to)参数,但是这些参数似乎只会截断计算,而不会更改窗口,因此0处的密度与数据一致,如以下图所示: lines(density(x, from = 0), col = 'black') (如果插值被更改,我希望黑线在0处的密度比灰线高) 此功能是否有替代方法可以更好地计算零密度?
10 r  probability  kde 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.