包含反对无效假设重要性检验的论点的参考文献？

在过去的几年中，我阅读了许多反对在科学中使用零假设重要性检验的论文，但并不认为要保留一个持久的清单。一位同事最近要求我提供这样的列表，所以我想我要请这里的所有人来帮助构建它。首先，这是我到目前为止的事情：

— Mike Lawrence
source

它不是100％相关的，因此我不会将其发布为答案。但是，JPA Ioannidis，为什么大多数已发表的研究结果都是错误的，《公共科学图书馆杂志》第 2卷（8）：e124，2005。值得一读。

— 主教

经济学家中的一本著名著作是齐莉亚克（Ziliak），史蒂芬·史蒂芬（Stephen T.）和狄尔德（Deirdre Nansen Mccloskey）。具有统计意义的崇拜：标准错误如何使我们付出工作，正义和生命的代价。密歇根大学出版社，2008

— 。– Waldemar 2014年

目的是什么？

— 阿萨卡（Aksakal）

2016年3月，ASA发布了正式的“ p值声明”。

— 肯尼·

此页面上列出了很多参考（包括评论）：lesswrong.com/lw/g13/against_nhst。Glen_b的答案在这里有更多参考：stats.stackexchange.com/questions/142533。

— amoeba

克里斯·弗雷利（Chris Fraley）教授了有关辩论历史的整个课程（尽管该链接仍在他的官方网站上，但该链接似乎已断开；这是Internet Archive中的副本）。他的摘要/结论在这里（再次是存档副本）。根据弗雷利（Fraley）的主页，他最后一次教这门课程是在2003年。

他以“教师的偏见”作为这份名单的开头：

尽管我的目标是促进就当前问题进行热烈，深入和公正的讨论，但我认为有必要从一开始就明确我的偏见。保罗·迈尔（Paul Meehl）曾经说过：“费希尔（Fisher）先生迷惑了我们，使我们着迷，并带领我们走上了报春花的道路。我相信，几乎所有人都只依赖于否定假设作为在软件中证实实质性理论的标准方法。领域是一个可怕的错误，基本上是不正确的，科学策略差，是心理学史上最糟糕的事情之一。” 我赞同Meehl的观点。我在本次研讨会中的目标之一是弄清楚为什么我相信这种情况。此外，我希望您在完成本次研讨会之前，

如果课程页面消失，我将在阅读清单中进行复制：

第一周。简介：什么是零假设意义检验？事实，神话与我们的科学状况

Lyken，DL（1991）。心理学怎么了？在D. Cicchetti和WM Grove（ed。）中，《对心理学的清晰思考》，第一卷。1：公共事务，为纪念Paul E. Meehl撰写的散文（第3 – 39页）。明尼苏达州明尼阿波利斯：明尼苏达大学出版社。

第2周。NHST的早期批评

Meehl，PE（1967）。心理学和物理学中的理论测试：方法论悖论。科学哲学，第34卷，第103-115页。

Meehl，PE（1978）。理论上的风险和表格上的星号：卡尔爵士，罗纳德爵士，以及软心理学进展缓慢。咨询与临床心理学杂志，46，806-834。

WW.Rozeboom（1960）。原假设重要性检验的谬误。心理公报，57，416-428。

Bakan，D。（1966）。在心理学研究中的意义检验。心理通报，66，423-437。[可选的]

第3周。NHST的当代批评

Cohen，J。（1994）。地球是圆形的（p <.05）。美国心理学家，49，997-1003。

Gigerenzer，G。（1993）。统计推理中的超我，自我和id。在G. Keren＆C. Lewis（编辑）中，《行为科学中的数据分析手册：方法论问题》（第311-339页）。新泽西州希尔斯代尔：劳伦斯·埃尔鲍姆协会。

Schmidt，FL＆Hunter，JE（1997）。在研究数据的分析中，有八种常见但错误的反对意见是中止显着性检验。在Lisa A. Harlow，Stanley A. Mulaik和James H. Steiger（编辑）中，如果没有显着性检验怎么办？（第37-64页）。新泽西州Mahwah：劳伦斯·埃尔鲍姆协会（Lawrence Erlbaum Associates）。

Oakes，M。（1986）。统计推断：对社会科学和行为科学的评论。纽约：威利。（第2章[重要性检验批判]）[可选]

第4周：反驳：NHST的拥护者为之辩护

弗里克，RW（1996）。适当使用原假设检验。心理方法，1，379-390。

Hagen，RL（1997）。赞扬原假设的统计检验。美国心理学家，52岁，15-24。

威尔金森，L。，以及统计推断工作组。（1999）。心理学期刊中的统计方法：指南和解释。美国心理学家，54，594-604。

Wainer，H.（1999）。为零假设重要性测试欢呼。心理方法，第6卷，第212-213页。

Mulaik，SA，Raju，NS和Harshman，RA（1997）。有进行重要性测试的时间和地点。在Lisa A. Harlow，Stanley A. Mulaik和James H. Steiger等编着。如果没有显着性检验怎么办？（第65-116页）。新泽西州Mahwah：劳伦斯·埃尔鲍姆协会（Lawrence Erlbaum Associates）。[可选的]

第5周：反驳：NHST的拥护者为之辩护

阿贝尔森，RP（1997）。关于乱马的惊人寿命：为什么要进行显着性检验？心理科学，8，12-15。

Krueger，J。（2001）。零假设意义检验：关于有缺陷方法的生存。美国心理学家，56岁，16-26岁。

Scarr，S。（1997）。证据规则：统计辩论的大背景。心理科学，8，16-17。

Greenwald，AG，Gonzalez，R.，Harris，RJ，和Guthrie，D。（1996）。效应大小和p值：应该报告什么，应该重复什么？心理生理学，33，175-183。

Nickerson，RS（2000）。空假设重要性检验：回顾一个古老且持续的争议。心理方法，第5卷，第241-301页。[可选的]

哈里斯，RJ（1997）。重要性测试有其地位。心理科学，8，8-11。[可选的]

第六周，效果大小

Rosenthal，R。（1984）。社会研究的荟萃分析程序。加利福尼亚州贝弗利山庄：Sage。[Ch。2，界定研究成果]

Chow，SL（1988）。显着性检验或效应量？心理通报，103，105-110。

阿贝尔森，RP（1985）。方差解释悖论：一点点很多。心理通报，97，129-133。[可选的]

第七周。统计能力

Hallahan，M.和Rosenthal，R.（1996）。统计能力：概念，过程和应用。行为研究与治疗，34，489-499。

Sedlmeier，P。和Gigerenzer，G。（1989）。统计能力研究对研究能力有影响吗？心理通报，105，309-316。

Cohen，J。（1962）。异常社会心理研究的统计能力：综述。异常与社会心理学杂志，65，145-153。[可选的]

Maddock，JE，Rossi，JS（2001）。在三种与健康心理学相关的期刊上发表的文章的统计能力。健康心理学，第20卷，第76-78页。[可选的]

托马斯·L·胡安斯·F。（1996）。统计功效分析的重要性：“动物行为”中的一个例子。动物行为，52，856-859。[可选的]

Rossi，JS（1990）。心理研究的统计能力：20年间我们获得了什么？咨询与临床心理学杂志，58，646-656。[可选的]

Tukey，JW（1969）。分析数据：成圣还是侦探工作？美国心理学家，第24卷，第83-91页。[可选的]

第8周。置信区间和重要性测试

Gardner，MJ和DG Altman。1986年。置信区间而不是P值：估计而不是假设检验。英国医学杂志，292，746-750。

卡明，G。，和芬奇，S。（2001）。基于中心和非中心分布的理解，使用和计算置信区间的入门。教育和心理测量，61，532-574。

Loftus，GR和Masson，MEJ（1994）。在受试者内部设计中使用置信区间。心理研究与评论，第1卷，第476-490页。

第9周[注意：我们正在跳过本节]。理论建模：开发自然现象的形式模型

Haefner，JW（1996）。生物系统建模：原理和应用。纽约：国际汤姆森出版社。（第1章[系统模型]和第2章[建模过程]）

Loehlin，JC（1992）。潜在变量模型：因子，路径和结构分析的简介。新泽西州希尔斯代尔：劳伦斯·埃尔鲍姆协会。（第1章[因子，路径和结构分析中的路径模型]，第1-18页）

格兰特（DA）（1962）。测试原假设和研究理论模型的策略。心理评论，69，54-61。[可选的]

Binder，A。（1963）。关于检验零假设以及理论模型研究的策略和策略的进一步考虑。心理评论，70，107-115。[可选的]

爱德华兹，W。（1965）。关于科学和统计假设之间关系的战术说明。心理公报，63，400-402。[可选的]

第10周。概率是什么意思？有关相对频率和主观概率的争论

Salsburg，D.（2001）。女士品尝茶：在20世纪，统计学如何革新了科学。纽约：WH Freeman。（第10、11和12章）

Oakes，M。（1986）。统计推断：对社会科学和行为科学的评论。纽约：威利。（第4、5和6章）

Pruzek，RM（1997）。贝叶斯推理及其应用简介。在Lisa A. Harlow，Stanley A. Mulaik和James H. Steiger等编着。如果没有显着性检验怎么办？（第287-318页）。新泽西州Mahwah：劳伦斯·埃尔鲍姆协会（Lawrence Erlbaum Associates）。

Rindskoph，DM（1997）。测试“小”而不是零的假设：古典和贝叶斯方法。在Lisa A. Harlow，Stanley A. Mulaik和James H. Steiger（编辑）中。如果没有显着性检验怎么办？（第319-332页）。新泽西州Mahwah：劳伦斯·埃尔鲍姆协会（Lawrence Erlbaum Associates）。

爱德华兹，W。，林德曼，H。，萨维奇，LJ（1963年）。贝叶斯统计推断用于心理学研究。心理评论，70，193-242。[可选的]

第十一周：理论评估：科学哲学与理论的检验与修正

Meehl，PE（1990）。评估和修正理论：拉卡托斯人的防御策略和两个有根据的原则。心理咨询，1，108-141。

Roberts，S.＆Pashler，H.（2000）。合适的说服力如何？关于理论测试的评论。心理评论，107，358-367。

第十二周：理论评估：科学哲学与理论的检验与修正

Urbach，P.（1974）。“智商辩论”的进展与退化（上）。英国科学哲学杂志，第25卷，第99-125页。

Serlin，RC和Lapsley，DK（1985年）。心理研究的合理性：充分原则。美国心理学家，40，73-83。

达尔河（1987）。再来看Meehl，Lakatos和心理学家的科学实践。美国心理学家，第42卷，第145-151页。

Gholson，B.＆Barker，P.（1985年）。Kuhn，Lakatos和Laudan：在物理学和心理学史上的应用。美国心理学家，40：755-769。[可选的]

Faust，D。和Meehl，PE（1992）。使用科学方法解决科学史和科学哲学中的问题：一些插图。行为疗法，23，195-211。[可选的]

Urbach，P.（1974）。“智商辩论”的进展与退化（二）。英国科学哲学杂志，第25卷，第235-259页。[可选的]

WC的Salmon（1973年5月）。确认。《科学美国人》，228，75-83。[可选的]

Meehl，PE（1993）。科学哲学：帮助还是阻碍？心理报告，72，707-733。[可选] Manicas。PT＆Secord，PF（1983）。新科学哲学对心理学的启示。美国心理学家，38：399-413。[可选的]

第13周：NHST传统是否破坏了心理学的无偏见，累积性知识基础？

Cooper，H.，DeNeve，K。和Charlton，K。（1997）。寻找缺失的科学：人类学科委员会提交研究的命运。心理方法，第2卷，第447-452页。

佛罗里达州施密特（1996）。统计显着性检验和心理学的累积知识：对研究人员培训的启示。心理方法研究，1，115-129。

Greenwald，AG（1975）。对原假设的偏见的后果。心理通报，82，1-20。

Berger，JO和Berry，DA（1988）。统计分析和客观幻想。美国科学家，第76卷，第159-165页。

第14周。复制与科学诚信

Smith，NC（1970）。复制研究：心理学研究的一个被忽视的方面。美国心理学家，第25卷，第970-975页。

Sohn，D。（1998）。统计意义和可复制性：为什么前者不能预见后者。理论与心理学》第8卷第291-311页。

Meehl，PE（1990）。为什么关于心理学理论的研究总结常常无法解释。心理报告，66，195-244。

JR普拉特（1964）。强推论。科学146，347-353。

Feynman，RL（1997）。一定是在开玩笑，费曼先生！纽约：WW诺顿。（第章：货运科学）。

Rorer，LG（1991）。心理学中的一些科学神话。在D. Cicchetti和WM Grove（ed。）中，《对心理学的清晰思考》，第一卷。1：公共事务，为纪念Paul E. Meehl撰写的论文（第61-87页）。明尼苏达州明尼阿波利斯：明尼苏达大学出版社。[可选的]

Lindsay，RM＆Ehrenberg，ASC（1993）。复制研究的设计。美国统计学家，第47卷，第217-228页。[可选的]

第15周：定量思考：为什么我们需要心理学中的数学（而不是NHST本身）

Aiken，LS，West，SG，Sechrest，L.，＆Reno，RR（1990）。统计学，方法学和心理学测量方面的研究生培训：博士学位调查。北美的程序。美国心理学家，第45卷，第721-734页。

Meehl，PE（1998年5月）。定量思考的力量。在美国华盛顿特区美国心理学会年会上受邀成为詹姆斯·麦肯·卡特尔奖得主。

— Michael Bishop
source

+1。有趣的是-很明显-读数以Meehl开始和结束。

— ub

您在分享此内容方面做得非常出色。

— rolando2

与课程和摘要的链接似乎已断开。您可以通过“存档”项目找到该信息：web.archive.org/web/20151023151618/http

— AG

这些都是极好的参考。我在http://biostat.mc.vanderbilt.edu/wiki/pub/Main/FHHandouts/whyBayesian.pdf上有一份有用的讲义

— 弗兰克·哈雷尔
source

402引文质疑在观察研究中不加区分地使用零假设假设显着性检验：http : //warnercnr.colostate.edu/~anderson/thompson1.html

— 亚历克斯
source