Questions tagged «fallacy»

30
什么是常见的统计罪过?
我是心理学的研究生,随着我从事越来越多的统计学独立研究,我对正规培训的不足感到越来越惊讶。无论是个人经验还是二手经验,都表明,在心理学领域,本科和研究生培训中缺乏统计严格性的情况非常普遍。因此,我认为对于像我这样的独立学习者来说,创建一个“统计罪孽”列表是很有用的,将教给学生分级的统计实践列表为标准实践,而实际上这些实践要么被上级(更强大,或更灵活,或者健壮等)或坦率地说是无效的。预计其他领域也可能会遇到类似的情况,因此,我提出了一个社区Wiki,我们可以在其中收集跨学科的统计犯罪列表。
227 fallacy 

10
回归均值vs赌徒的谬误
一方面,我具有对均值的回归,另一方面,我具有赌徒的谬误。 Miller和Sanjurjo(2019)将赌徒的谬误定义为“错误地认为随机序列具有系统性的逆转趋势,即类似结果的条纹更有可能结束而不是持续。”例如,一枚掉头的硬币在下一次审判中,连续几次被认为很有可能落伍。 根据上次的平均值回归,我在上一场比赛中表现不错,而在下一场比赛中,我的表现可能会更差。 但是根据赌徒的谬误:假设硬币是公平的,请考虑以下两个概率 20头的概率,然后1尾= 0.520×0.5=0.5210.520×0.5=0.5210.5^{20} × 0.5 = 0.5^{21} 20头的概率,则1头= 0.520×0.5=0.5210.520×0.5=0.5210.5^{20} × 0.5 = 0.5^{21} 然后... 考虑一个简单的例子:一类学生对一个主题进行100项对/错测试。假设所有学生在所有问题上随机选择。然后,每个学生的分数将是一组独立且均匀分布的随机变量中的一个的实现,预期均值为50。 自然,偶然地,有些学生的分数将大大高于50,而有些分数将大大低于50。如果一个人只拿得分最高的10%的学生,然后再给他们第二次测试,然后他们再次在所有项目上随机选择,那么平均得分将再次接近50。 因此,这些学生的均值将一直“回归”到所有参加原始考试的学生的均值。无论学生在原始考试中得分是多少,他们在第二项考试中得分的最佳预测是50。 特殊情况下,如果只拿得分最高的10%的学生,然后再给他们第二次测试,然后他们再次在所有项目上随机选择,则平均得分将再次接近50。 根据赌徒的谬论,难道不应该期望得分的可能性相同,而不一定要接近50吗? Miller,JB和Sanjurjo,A.(2019)。当样本量被忽略时,经验如何确定赌徒的谬误。

6
德州神枪手在探索性数据分析中的谬误
我在《自然》杂志上读过这篇文章,其中在数据分析的背景下解释了一些谬误。我注意到德州神枪手的谬误特别难以避免: 德州神枪手的寓言说明了在数据分析过程中等待的认知陷阱:一个无能的射手,他在谷仓侧面发射随机的子弹图案,围绕最大的子弹孔绘制目标,并自豪地指向他的成功。 他的靶心显然是可笑的-但对于那些在连胜的过程中相信“一手好牌”的赌徒,或者在所有奇数都出现彩票时看到超自然意义的人来说,谬论并不那么明显。 对于研究人员来说也不总是很明显。“您只是从数据中得到一些鼓励,然后思考,这是走下坡路,” Pashler说。“您没有意识到自己有27种不同的选择,而是选择了一个给您最满意或最有趣的结果的选择,现在您从事的并不是完全无偏的数据表示。” 我认为这种探索工作是司空见惯的,而且通常是在那部分分析的基础上建立假设的。有一个专用于此过程的整体方法(EDA): 约翰·图基(John Tukey)倡导探索性数据分析,以鼓励统计学家探索数据,并可能提出可能导致新数据收集和实验的假设 似乎在没有事先假设的情况下执行的任何探索性过程都容易产生虚假假设。 请注意,上面对EDA的描述实际上是在谈论new data collection and experiments。我了解到,在收集了新数据之后,就需要进行验证性数据分析(CDA)。但是,我认为这种区分并不十分清楚,尽管将EDA和CDA分开是理想的,但是肯定在某些情况下这是不可行的。我要说的是,严格遵循这种分离并不常见,而且大多数从业人员根本不赞成EDA范式。 所以我的问题是:EDA(或任何非正式的数据浏览过程)是否会使德州神枪手的谬误更有可能崩溃?
23 eda  fallacy 

4
根据统计信息做出错误决策的战争故事?
我认为可以说统计学是一门应用科学,因此在计算平均值和标准差时,是因为有人希望根据这些数字做出一些决策。 作为一名出色的统计学家,我希望能够“感知”何时可以信任样本数据,以及何时某些统计测试完全歪曲了我们感兴趣的真实数据。成为对分析感兴趣的程序员大数据集我正在学习一些统计数据和概率论,但我无法摆脱这种this的感觉,即我看过的所有书都像是政客,登上舞台,讲了很多话,然后追加演讲结束时的以下免责声明: 现在,我并不是说这是好事还是坏事,但是数字表明这很好,所以无论如何您都应该投票支持我。 也许您明白了,但您可能没有,这是一个问题。我该去哪里找统计学家的战争故事,而他们的决策是基于某些统计信息的,后来又证明是完全错误的?

2
方差的线性
我认为以下两个公式是正确的: Var(aX)=a2Var(X)Var(aX)=a2Var(X) \mathrm{Var}(aX)=a^2 \mathrm{Var}(X) 而a是一个常数 如果,独立Var(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y) \mathrm{Var}(X + Y)=\mathrm{Var}(X)+\mathrm{Var}(Y) XXXYYY 但是,我不确定以下内容有什么问题: Var(2X)=Var(X+X)=Var(X)+Var(X)Var(2X)=Var(X+X)=Var(X)+Var(X)\mathrm{Var}(2X) = \mathrm{Var}(X+X) = \mathrm{Var}(X) + \mathrm{Var}(X) 不等于,即。22Var(X)22Var(X)2^2 \mathrm{Var}(X)4Var(X)4Var(X)4\mathrm{Var}(X) 如果假设是从总体中抽取的样本,我想我们总是可以假设与其他 s 独立。XXXXXXXXX 那么我的困惑到底出了什么问题?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.