我刚刚使用Logistic回归对数据进行了分析,但是还需要在报告中包含描述性的统计部分。老实说,我没有明白这一点,我希望有人能够解释为什么这样做是必要的。
例如,如果我绘制了一个独立连续变量的直方图,并且显示了正态性或显示了偏度,这将如何为报表添加任何值?
我的数据包含一份工作的正确或错误因变量,独立变量是期中成绩,期末考试成绩以及男女。
我刚刚使用Logistic回归对数据进行了分析,但是还需要在报告中包含描述性的统计部分。老实说,我没有明白这一点,我希望有人能够解释为什么这样做是必要的。
例如,如果我绘制了一个独立连续变量的直方图,并且显示了正态性或显示了偏度,这将如何为报表添加任何值?
我的数据包含一份工作的正确或错误因变量,独立变量是期中成绩,期末考试成绩以及男女。
Answers:
在我的领域中,报告的描述性部分非常重要,因为它为结果的可概括性设置了上下文。例如,研究人员希望从医院的样本中识别出摩托车事故后脑部受伤的预测因素。她的因变量是二进制,并且她有一系列自变量。多变量逻辑回归使她产生了以下发现:
需要明确的是,建模没有问题。我们关注描述性统计信息可以增加的价值。
没有描述性的统计数据,读者就无法正确看待这些发现。为什么?让我向您展示描述性统计数据:
age, years, mean (SD) 54 (2)
males, freq (%) 490 (98)
blood alcohol level, %, mean (SD) 0.10 (0.01)
...
从上面您可以看到,她的样本由年龄较大,醉酒的男性组成。有了这些信息,读者就可以说出这些结果可以说出有关年轻男性受伤或未醉酒的骑手或女性骑手的伤害的信息。
请不要忽略描述性统计数据。
提供描述性统计数据的目的是表征您的样本,以便其他中心或国家的人们可以评估您的结果是否适用于他们的情况。因此,在您的情况下,将性别,年级等制表是对逻辑回归的有益补充。这不是使人们能够检查您的假设,尽管他们也可能尝试这样做。
==============编辑以链接到健康中使用的一些准则
在我熟悉的健康领域,有一些特定的报告准则。这些都已在EQUATOR网络中一起收集,应查询最新信息。
例如,我们可以进行相关指导为CONSORT的临床试验。在概述此处和其他地方可用指南的文档中,我们阅读了表1建议15“显示每个组的基线人口统计学和临床特征的表”。
对于其他研究类型也有类似的建议。