报告描述性统计数据有什么意义?


21

我刚刚使用Logistic回归对数据进行了分析,但是还需要在报告中包含描述性的统计部分。老实说,我没有明白这一点,我希望有人能够解释为什么这样做是必要的。

例如,如果我绘制了一个独立连续变量的直方图,并且显示了正态性或显示了偏度,这将如何为报表添加任何值?

我的数据包含一份工作的正确或错误因变量,独立变量是期中成绩,期末考试成绩以及男女。


如果您在绘制IV直方图时看不到任何价值,那么也许您不应该这样做,但是您收集的任何数据对您要呈现的工作都具有一定的价值那个报告?
Ian_Fin

嗨,伊恩,我为我的问题添加了更多细节。我对统计还很陌生,我只是想知道在进行逻辑回归之前是否有一种通用方法。
user3223190 '16

我建议还查看并可能包括各种数据图。例如,您可以绘制按性别用色码标记的最终成绩与中期成绩,用“获得工作”和“无法获得工作”的符号来绘制符号。
Emil M Friedman

Answers:


42

在我的领域中,报告的描述性部分非常重要,因为它为结果的可概括性设置了上下文。例如,研究人员希望从医院的样本中识别出摩托车事故后脑部受伤的预测因素。她的因变量是二进制,并且她有一系列自变量。多变量逻辑回归使她产生了以下发现:

  • 与头盔使用相比,没有头盔使用调整后的OR = 4.5(95%CI 3.6,5.5)。
  • 所有其他变量均未包含在最终模型中。

需要明确的是,建模没有问题。我们关注描述性统计信息可以增加的价值。

没有描述性的统计数据,读者就无法正确看待这些发现。为什么?让我向您展示描述性统计数据:

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

从上面您可以看到,她的样本由年龄较大,醉酒的男性组成。有了这些信息,读者就可以说出这些结果可以说出有关年轻男性受伤或未醉酒的骑手或女性骑手的伤害的信息。

请不要忽略描述性统计数据。


5
很好的例子。是真实的还是虚构的?
变形虫说莫妮卡

5
谢谢,@ amoeba。数字和统计数据是真实的。但是,为了保护无辜者,我将主题更改为脑外伤。

3
因此,醉酒的男子骑着没有头盔的摩托车……谁会想到您会因脑部受伤而结局?
gung-恢复莫妮卡

我当时享受着一杯漂亮的澳大利亚红,鲍勃是你的叔叔……

25

提供描述性统计数据的目的是表征您的样本,以便其他中心或国家的人们可以评估您的结果是否适用于他们的情况。因此,在您的情况下,将性别,年级等制表是对逻辑回归的有益补充。这不是使人们能够检查您的假设,尽管他们也可能尝试这样做。

==============编辑以链接到健康中使用的一些准则

在我熟悉的健康领域,有一些特定的报告准则。这些都已在EQUATOR网络中一起收集,应查询最新信息。

例如,我们可以进行相关指导为CONSORT的临床试验。在概述此处和其他地方可用指南的文档中我们阅读了表1建议15“显示每个组的基线人口统计学和临床​​特征的表”。

对于其他研究类型也有类似的建议。


谢谢mdewey,所以当我们做各种描述​​性情节时,如果我们注意到正态性或偏斜性,为什么只对它进行评论。因此,基本上,描述性统计仅真正用于告知读者您正在使用哪些数据。如果这看起来很基本

这就是它在健康领域的工作方式,这是我最熟悉的一种。
mdewey '16

8
+1。起初,我把“在其他中心或国家”误读为“在其他世纪中”。
变形虫说恢复莫妮卡

4

另一件事是显示变量的表现如何。例如,如果您的变量之一是薪水,而您恰好采访了一位亿万富翁,那么当您在逻辑回归中输入他的薪水时,它将主导其他所有事情,因此您可能会学会忽略薪水,无论它可能包含多少实际信息。

有些方法对偏度和极值比较敏感,而逻辑回归则比较敏感。当然,最终的证明是在布丁中,您可以将获得的结果与原始数据进行比较,或者将每个特征转换为正态进行比较。


1

描述部分有助于了解读者您的数据集。在应用经济中,通常强烈建议您使用它,因为它可能会显示出分析中的第一个潜在缺陷。

您可以使用来自不同来源的数据来扩展您的描述。

1张桌子就足够了。您附带的那个不是很直观。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.