显然有许多方法可以滥用统计方法。您是否知道在公认的学术期刊上首先作为显式建议(例如,“您应使用此方法...”)发表过一些不良统计实践的例子?
一个示例可能是每个预测变量规则的10个事件,通常会在logistic或Cox PH回归模型(LINK)中调用该事件。
需要明确的是,我并不是指被引用次数很高的论文碰巧使用了不良的统计方法-不幸的是,这些论文很少见。
显然有许多方法可以滥用统计方法。您是否知道在公认的学术期刊上首先作为显式建议(例如,“您应使用此方法...”)发表过一些不良统计实践的例子?
一个示例可能是每个预测变量规则的10个事件,通常会在logistic或Cox PH回归模型(LINK)中调用该事件。
需要明确的是,我并不是指被引用次数很高的论文碰巧使用了不良的统计方法-不幸的是,这些论文很少见。
Answers:
在计量经济学中,您一定可以找到一些体面的期刊上发表的知名(且技术娴熟)的计量经济学家传播方法的示例。我不了解理论论文,但Lalonde(1986)指出当前使用的方法效果不佳:他比较了相同数据集的实验方法和观察方法,发现(因果)治疗领域存在很大差异评估。有大量文献的确传播了这些非实验方法,这些方法在那时已经被使用,并且今天仍然经常使用。
随后,有(并且我认为仍然是)关于倾向得分匹配是否是可能的解决方案的争论(例如,参见此处)。
此外,关于工具变量估计存在很多争议。被高引用的原始论文的结论存在争议。这可能是最接近您问题的示例。Bound和Jaeger(1996年,及其后的论文)质疑了Angrist和Krueger(1991;根据Google Scholar引用2700)的著名论文的发现,该论文基本上在应用计量经济学文献中建立了工具变量方法。
关于建立因果关系的所谓简化形式估计的适当性也有大量争论,例如,参见Imbens(2010)。
当然,另一个大话题是关于标准错误。也许可以找到传播p值的著名论文。在计量经济学中,由于存在错误的现有方法,经常会错误地计算出较长时间序列的标准误差(在差分设计中),请参见此处。但是,我不知道在这种情况下提出这些方法的原始高被引论文,但是我相信您会在这方面找到一些例子。
资料来源:
Angrist,Joshua D.和Alan B. Keueger。“义务教育是否会影响入学和收入?”。经济学季刊106,第1期。4(1991):979-1014。
Bertrand,Marianne,Esther Duflo和Sendhil Mullainathan。“我们应该相信差异差异估计有多少?” 经济学季刊119号。1(2004):249-275。
Bound,John和David A. Jaeger。关于出生季节作为工资等式中工具的有效性:对Angrist&Krueger的“义务教育出勤率是否会影响学校号w5835”的评论。国家经济研究局,1996年。
拉杰夫的德赫加。“实用倾向得分匹配:对史密斯和托德的答复。” 计量经济学杂志125,no。1-2(2005):355-364。
Imbens,GuidoW。“迟迟没有成功:对Deaton(2009)和Heckman and Urzua(2009)的一些评论。” 经济文献杂志48,第1期。2(2010):399-423。
LaLonde,RobertJ。“使用实验数据评估培训计划的计量经济学评估。” 美国经济评论(1986):604-620。*
我尝试一下(尽管不那么强大):
非常有用[Cameron,AC,&Miller,DL(2015)。集群鲁棒推理的从业人员指南。Journal of Human Resources,50(2),317-372。] //已有1900篇Google学术论文引用//提供了有关标准错误聚类适当水平的建议:
“共识是保守,避免偏见,并在可能的情况下使用更大和更多的聚合集群,直到并包括人们担心集群太少的时候为止。”
但是,[Abadie,A.,Athey,S.,Imbens,GW,&Wooldridge,J.(2017)。何时应调整群集的标准错误?(编号w24003)。国家经济研究局。]表明“事实上,聚集程度过高实际上是有害的”。请参阅后面的第1页:https : //economics.mit.edu/files/13927
也许您还可以从Abadie等人(2017)强调的两个误解开始做出更糟的案例。