条件密度图的解释


10

我想知道如何正确解释条件密度图。我在下面用R创建的下面插入了两个cdplot

例如,当变量1为150时大约80%的结果等于1 的概率吗?

条件密度图

暗灰色区域是Result等于1 的条件概率,对吧?

条件密度图

cdplot文档中:

在给定y的水平(由y的边际分布加权)的情况下,cdplot计算x的条件密度。密度是在y级别上累积得出的。

这种积累如何影响这些图的解释?

Answers:


7

例如,当变量1为150时大约80%的结果等于1的概率吗?

不,这是另一回事。Var1时Result的概率约为80%。同样,当Var1时Result的概率约为20%。=0=150=1个=150

暗灰色区域是结果等于1的条件概率,对吧?

深色阴影区域对应于Result;阴影区域对应于Result。=0=1个

如果您的结果因子中有两个以上的级别,那么所描绘的内容可能会更加明显。我们只是习惯于查看密度函数,因此此演示起初可能会造成混淆。

这种积累如何影响这些图的解释?

从来源cdplot()来看,我认为这是结果的平滑比例由解释变量的密度加权的结果。因此,将在解释变量的较高密度区域更好地表示因变量的分布。

一种解释的方式是,在解释变量的区域很少点的情况下,条件分布将无法确定。在解释变量的区域具有更多点的情况下,将更好地确定条件分布。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.