Questions tagged «statistics-in-media»

5
一个“控制其他变量”到底如何?
这是引起这个问题的文章:不耐烦会使我们发胖吗? 我喜欢这篇文章,它很好地展示了“控制其他变量”(IQ,职业,收入,年龄等)的概念,以便最好地隔离所讨论的两个变量之间的真实关系。 您可以向我解释一下如何实际控制典型数据集上的变量吗? 例如,如果您有2个人的耐心程度和BMI相同,但收入不同,您将如何处理这些数据?您是否将他们分为收入,耐心和BMI相似的不同子组?但是,最终有数十个变量需要控制(IQ,职业,收入,年龄等),然后如何汇总这些(潜在地)100个子组?实际上,现在我已经说了出来,我有一种感觉是这种方法使错误的树陷入困境。 感谢您为我几年来一直想深入了解的事情提供任何信息...!


3
新闻中的方程式:将多层次模型转换为普通受众
纽约时报对用于向纽约市教育工作者提供反馈的“增值”教师评估系统有很长的评论。lede是用于计算分数的等式-无需上下文即可呈现。修辞策略似乎是通过数学恐吓: 该文章的全文可在以下网站获得:http : //www.nytimes.com/2011/03/07/education/07winerip.html 作者迈克尔·怀恩里普(Michael Winerip)认为,该方程式的意义超出了马特·达蒙(Matt Damon)以外的任何人的理解能力,更不用说普通教师了: “艾萨克森女士的3.69预测分数的计算更加令人生畏。它基于32个变量-包括学生是否“在考试前一年保持了年级”,以及学生是否是“在考试前或考试后新来的城市”年。” 这32个变量被插入到一个统计模型中,该模型看起来像是在“善意狩猎”中只有Matt Damon能够解决的方程式之一。 这个过程看起来是透明的,但显然是泥泞的,即使对于像教师,校长和记者(我对此也犹豫不决)这样​​的聪明人来说也是如此。 艾萨克森女士可能有两个常春藤联盟学位,但她迷路了。她说:“我发现这是无法理解的。” 用简单的英语来说,艾萨克森女士对教育部试图告诉她的最好的猜测是:即使她的66名学生中有65名在州考试中获得了熟练的成绩,但她的3分中的3分应该是4分。 但这只是一个猜测。” 您将如何向外行解释该模型?仅供参考,完整的技术报告位于: http://schools.nyc.gov/NR/rdonlyres/A62750A4-B5F5-43C7-B9A3-F2B55CDF8949/87046/TDINYCTechnicalReportFinal072010.pdf 更新:Andrew Gelman在这里提供了他的想法:http : //www.stat.columbia.edu/~cook/movabletype/archives/2011/03/its_no_fun_bein.html

1
关于《纽约时报》滥用统计方法的文章
我指的是这篇文章:http : //www.nytimes.com/2011/01/11/science/11esp.html 考虑以下实验。假设有理由相信硬币的重量略偏于头部。在测试中,硬币在1,000的硬币中冒出527次。 这是否是代币已加权的重要证据? 古典分析说是的。有了一个公平的硬币,在1,000次翻转中获得527个或更多的磁头的机会就小于传统分界点的20分之一或5%。换句话说,实验发现加权硬币的证据“具有95%的置信度”。 然而,许多统计学家并不买账。20个中的一个是一千次掷出526以上的任何头的概率。即,它是翻转概率527,翻转概率528、529等等的总和。 但是实验并未找到该范围内的所有数字。他们发现只有一个-527。因此,这些专家说,如果硬币被加权,则计算得到那个数字-527的概率会更准确,然后将硬币与获得相同数字的概率进行比较。公平。 统计学家保罗·斯派克曼(Paul Speckman)和心理学家杰夫·劳德(Jeff Rouder)一起提供了例子,统计学家可以证明这个比率不能高于4:1。 第一个问题:这对我来说是新的。有没有人提供我可以找到精确计算的参考,和/或您可以通过自己给我精确计算来帮助我,和/或您可以指出一些可以在其中找到相似示例的材料吗? 贝叶斯设计了一种方法,可以在出现新证据时更新假设的可能性。 因此,在评估给定发现的强度时,贝叶斯分析(发音为BAYZ-ee-un)会纳入研究以外的已知概率(如果有)。 它可能被称为“是的,正确的”效果。如果一项研究发现金橘可将心脏病风险降低90%,一种疗法可在一周内治愈酒精成瘾,敏感的父母生女孩的可能性是男孩的两倍,那么贝叶斯的反应与本地怀疑论者:是的,对。研究结果与世界上可观察到的结果进行权衡。 在至少一个医学领域–诊断筛选测试–研究人员已经使用已知的概率来评估新发现。例如,一项新的测谎测试可能具有90%的准确率,可以正确标记10个骗子中的9个。但是,如果将其提供给100个已知已经包括10个骗子的人群,那么这项测试的效果就不那么令人印象深刻了。 它可以正确识别10个撒谎者中的9个,并且错失1个;但错误地将其他90个中的9个标识为说谎。将所谓的“真实肯定”(9)除以测试标记的总人数(18),得出的准确率为50%。“假阳性”和“假阴性”取决于人口中已知的比率。 第二个问题:您如何用这种方法正确判断一个新发现是否“真实”?并且:由于使用了一些预先设定的先验概率,这是否不像5%屏障那样任意?

2
为什么《辛普森一家》(电视连续剧)在预测未来方面如此成功?[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 2年前关闭。 在黄色而非黄色媒体中,它得到了广泛的评论,以至于《辛普森一家》(电视连续剧)反复预测了未来。关于它的综合在线文章在这里和这里。如果您用谷歌 “辛普森一家预测未来”,那么您将获得数百万的点击量和视频。 也许最引人注目的“预测”(至少对我而言)是特朗普担任美国总统(2000年作出!)。最新的似乎是加拿大大麻的合法化。 问题是,为什么这种明显的成功? 我的猜测是,(i)辛普森一家做出了很多 “预测”(而是建立了情景),(ii)从统计学上来说,点击率实际上很低(不是我计算过)。明显的“成功”只是一种认知偏见。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.