6
基本数据检查测试
在我的工作中,我经常与其他人的数据集一起工作,非专家为我带来了临床数据,我帮助他们进行总结并进行统计检验。 我遇到的问题是,我带来的数据集几乎总是错字,不一致和其他各种问题。我很想知道其他人是否有标准测试,他们会尝试检查输入的任何数据集。 我过去常常为每个变量绘制直方图,但现在我意识到有很多可怕的错误可以在测试中幸免。例如,前几天我有一个重复测量数据集,对于某些人,该重复测量在时间2上与时间1上相同。这随后被证明是不正确的,正如您所期望的那样。另一个数据集包含一个个体,从非常严重的无序状态(以高分表示)变为无问题(以0表示)。这是不可能的,尽管我无法确切地证明这一点。 那么,我可以在每个数据集上运行哪些基本测试,以确保它们没有错别字并且不包含不可能的值? 提前致谢!