在逻辑回归中可视化类别的影响及其普遍性的最佳方法是什么?


11

我需要使用民意调查数据来介绍有关候选人投票的主要预测因子的信息。我已经使用我关心的所有变量进行了逻辑回归,但是我找不到一种很好的方式来显示此信息。

我的客户不仅在乎效果的大小,而且在乎效果的大小与具有此类属性的总体大小之间的相互作用。

如何在图形中处理呢?有什么建议么?

这是一个例子:

当候选变量中因变量为Vote / Not时,变量SEX(Male = 1)的为2.3,这是取幂并被视为比值比或概率后的大数。但是,进行此调查的社会只有30%的男性。因此,尽管人非常支持该候选人,但对于试图赢得多数选举的候选人而言,他们的人数并不重要。β


FWIW,术语“交互”的使用是不正确的(例如,参见此处此处)。我会说,“ ...但是要确定影响规模很大且具有此类属性的人口数量也很大的情况”。
gung-恢复莫妮卡

Answers:


10

我同意@PeterFlom的观点,这个例子很奇怪,但是撇开它,我注意到解释变量是分类的。如果始终是这样,它将大大简化这一过程。我将使用镶嵌图来呈现这些效果。镶嵌图垂直显示条件比例,但是每个类别的宽度相对于样本中其边际(即无条件)比例进行缩放。

这是使用R创建的泰坦尼克号灾难数据的示例:

data(Titanic)

sex.table   = margin.table(Titanic, margin=c(2,4))
class.table = margin.table(Titanic, margin=c(1,4))
round(prop.table(t(sex.table), margin=2), digits=3)
#          Sex
# Survived  Male Female
#      No  0.788  0.268
#      Yes 0.212  0.732
round(prop.table(t(class.table), margin=2), digits=3)
#           Class
# Survived   1st   2nd   3rd  Crew
#      No  0.375 0.586 0.748 0.760
#      Yes 0.625 0.414 0.252 0.240

windows(height=3, width=6)
  par(mai=c(.5,.4,.1,0), mfrow=c(1,2))
  mosaicplot(sex.table,   main="")
  mosaicplot(class.table, main="")

在此处输入图片说明

在左侧,我们看到女性更有可能生存,但男性约占船上人员的80%。因此,增加男性幸存者的比例将意味着挽救更多的生命,甚至比女性幸存者的百分比增加更大。这有点类似于您的示例。右边还有一个例子,机组人员和操舵人员占最大比例,但存活的可能性最低。(就其价值而言,这不是对这些数据的完整分析,因为阶级和性别也不独立于泰坦尼克号,但足以说明该问题的想法。)


5

我对哪个社会只有10%的男人有点好奇...但是...

您可以做的一件事是绘制比值比,并用样本的大小标记每个比值。

如果要用图形表示两个变量,则可以制作一个气泡图,使每个气泡在y轴上的位置与比值比的大小匹配,并且气泡的面积与样本大小成比例。


7
也许一个。
安德烈·席尔瓦
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.