统计取证:本福德及以后


23

有哪些广泛的方法可以检测第三方制作的科学作品中的欺诈,异常,伪造等情况?(最近马克·豪瑟(Marc Hauser)的事使我很想问这个问题。)通常对于选举和会计欺诈,会引用本福德定律的某些变体。我不确定如何将其应用于例如马克·豪瑟(Marc Hauser)案,因为本福德定律要求数字近似为对数统一。

举一个具体的例子,假设一篇论文引用了大量统计检验的p值。可以将其转换为对数均匀度,然后应用本福德定律吗?这种方法似乎会遇到各种各样的问题(例如,某些零假设可能合法地是错误的,统计代码可能会给出仅近似正确的p值,测试可能只会给出统一的p值渐近地在null下等)


2
这个问题迫切需要一个答案,该答案将提供统计取证的实际示例!接受的答案根本不行。最近有很多很好的例子,例如Simonsohn 2013Carlisle 2012(以及2015年的后续活动),Pitt和Hill 2013等,也许还有更多。
变形虫说恢复莫妮卡

Answers:


11

好问题!

在科学背景下,存在各种有问题的报告和有问题的行为:

  • 欺诈:我将欺诈定义为作者或分析师故意故意歪曲结果以及歪曲程度足够严重的情况。主要示例是原始数据或摘要统计信息的完整编制。
  • 错误:从数据输入,数据处理,分析,报告,解释到数据分析的许多阶段,数据分析师都可能出错。
  • 不当行为:有许多形式的不当行为。通常,它可以通过一个方向来概括,该方向试图确认一个特定的位置而不是寻找真相。

不良行为的常见示例包括:

  • 检查一系列可能的因变量,并仅报告具有统计意义的变量
  • 没有提及严重违反假设的情况
  • 在不提及数据的情况下执行数据处理和离群值删除程序,尤其是在这些程序既不合适又选择纯粹是为了使结果看起来更好的情况下
  • 提出一个模型作为验证性的,实际上是探索性的
  • 忽略与预期论点相反的重要结果
  • 仅基于统计测试才能使结果看起来更好,因此选择它
  • 运行一系列五到十项动力不足的研究,其中只有一项具有统计学意义(也许在p = .04),然后报告该研究而未提及其他研究

通常,我会假设无能与问题行为的所有三种形式有关。如果研究人员不懂得如何做好科学,但又想获得成功,就会有更大的动机来歪曲他们的结果,并且不太可能遵守道德数据分析的原则。

以上区别对发现有问题的行为有影响。例如,如果您设法识别出一组报告的结果是错误的,则仍然需要确定结果是否是由于欺诈,错误或不当行为引起的。另外,我认为各种形式的不当行为比欺诈要普遍得多。

关于检测有问题的行为,我认为这主要是一种技能,它来自于处理数据,处理主题以及与研究人员合作的经验。所有这些经验都增强了您对数据外观的期望。因此,与期望的重大偏离开始了寻找解释的过程。通过研究人员的经验,您可以了解某种或多或少常见的不当行为。综合起来,这导致了假设的产生。例如,如果我读了一篇期刊文章,并对结果感到惊讶,则该研究的动力不足,并且该著作的性质表明作者着手提出要点,那么我会得出一个假设,即结果可能不符合要求。值得信赖。

其他资源


4

实际上,本福德定律是一种非常强大的方法。这是因为Benford的第一位数字频率分布适用于现实世界或自然世界中出现的各种数据集。

没错,您只能在某些情况下使用本福德定律。您说数据必须具有统一的日志分布。从技术上讲,这是绝对正确的。但是,您可以以更简单,宽容的方式描述需求。您所需要的只是数据集范围至少跨越一个数量级。假设从1到9或10到99或100到999。如果它超过两个数量级,则说明您正在做生意。而且,本福德定律应该会很有帮助。

本福德定律的优点在于,它可以帮助您真正迅速地缩小干草堆数据中的范围。您正在寻找异常,由此第一位数字的频率与本福德频率大不相同。一旦注意到有两个很多6,就可以使用本福德定律只关注6。但是,您现在将其带到前两位数字(60、61、62、63等)。现在,也许您发现比Benford建议的要多得多的63s(您可以通过计算Benford的频率来做到这一点:log(1 + 1/63)为您提供接近0%的值)。因此,您将Benford用于前三个数字。到您发现的时候,出现了太多的632(或者通过计算本福德频率的任何东西:log(1 + 1/632)),超出了您的预期。并非所有异常都是欺诈。但,

如果马克·豪瑟(Marc Hauser)处理的数据集是自然的无约束数据,且相关范围足够广泛,那么本福德定律将是一个非常好的诊断工具。我相信还有其他好的诊断工具也可以检测出不太可能的模式,并且将它们与本福德定律结合使用,您很有可能有效地研究了马克·豪瑟事件(考虑到本福德定律提到的数据要求)。

在这个简短的演示中,我将进一步解释本福德定律,您可以在此处查看:http : //www.slideshare.net/gaetanlion/benfords-law-4669483

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.