Questions tagged «teaching»

对于有关概率和统计学教学的任何问题。

8
我应该先教贝叶斯统计还是常客统计?
我正在帮助正在读中学的男孩们了解统计学,并且我正在考虑从一些简单的例子开始,而不必理会理论上的一些内容。 我的目标是给他们一种最直观但最有建设性的方法,以从头开始学习统计学,以激发他们对进一步追求统计学和定量学习的兴趣。 不过,在开始之前,我有一个特别的问题,它具有非常普遍的含义: 我们是否应该开始使用贝叶斯或常客制框架教授统计学? 到处进行研究,我发现一种常见的方法是从对常客统计学的简要介绍开始,然后再深入讨论贝叶斯统计(例如Stangl)。

12
最难掌握的统计概念是什么?
这是与这里的问题类似的问题,但与我认为值得提出的问题足够不同。 我以为我是一个入门者,我认为最难掌握的东西之一。 我的是概率和频率之差。一个处于“对现实的了解”(概率)的水平,而另一个处于“现实本身”(频率)的水平。如果我考虑太多,这几乎总是让我感到困惑。 埃德温·贾恩斯(Edwin Jaynes)创造了一个称为“思维投射谬论”的术语,用以描述将这些东西混为一谈。 对其他难以把握的概念有什么想法吗?
32 teaching 

3
是否有一个类似Euler的机器学习项目?
我发现Project Euler http://projecteuler.net/在学习编程语言方面非常有用。是否有类似的机器学习网站? 我确实看到了http://www.kaggle.com/,但是对于初学者来说,它不如欧拉计画那样容易。
32 teaching 

5
教学抽样分布的策略
tl; dr版本 您采用了哪些成功的策略在入门级本科水平上教授(例如,样本均值的)样本分布? 背景 9月,我将使用David Moore 撰写的《统计基础知识》为二年级社会科学(主要是政治科学和社会学)课程的学生开设统计学入门课程。这是我第五次教这门课,我一直遇到的一个问题是,学生们确实在抽样分配的概念上挣扎。它作为推理的背景进行了介绍,并基本介绍了几经打initial后他们似乎没有遇到麻烦的概率(而从根本上讲,我的意思是基本-毕竟,这些学生中的许多人已经被自动选入了特定的课程流,因为他们试图避免甚至带有“数学”含糊暗示的任何事物。我猜想可能有60%的人对课程没有一点点的了解,大约25%的人了解原理,但不了解与其他概念的联系,其余15%的人完全理解。 主要问题 学生似乎遇到的麻烦是应用程序。除了说他们只是不明白之外,很难解释确切的问题是什么。从上学期进行的一项民意测验和考试答复中,我认为部分困难是两个相关且相似的发音短语(采样分布和样本分布)之间的混淆,因此我没有使用“样本分布”一词虽然如此,但可以肯定的是,虽然一开始令人困惑,但只需一点点努力就可以轻松解决它,并且无论如何也无法解释抽样分布概念的普遍困惑。 (我意识到这可能是我本人和我的教!在这里!但是,我认为忽略不合理的可能性是合理的做法,因为有些学生确实做到了,而且总体上每个人似乎都做得不错...) 我尝试过的 我不得不与我们系的本科生管理者争论,在计算机实验室中引入强制性课程,以为反复演示可能会有所帮助(在我开始教这门课程之前,不涉及计算)。虽然我认为这有助于总体上理解课程材料,但我认为这对特定主题没有帮助。 我曾经有过一个想法,就是根本不教它或不给它太多分量,这是某些人(例如安德鲁·盖尔曼)所主张的。我觉得这不是特别令人满意,因为它有教给最低公分母的感觉,更重要的是,拒绝坚强而又有上进心的学生,他们想通过真正了解重要概念的工作原理(不仅是抽样分布!)来学习更多有关统计应用的知识。 )。另一方面,中位学生似乎确实掌握了例如p值,因此也许他们根本不需要了解采样分布。 问题 您采用什么策略教授抽样分布?我知道有可用的材料和讨论(例如,这里和这里以及打开PDF文件的本文),但我只是想知道我是否可以得到一些对人有用的具体示例(或者我猜什至什么都不有用)因此我不会尝试!)。现在,正如我计划9月份的课程那样,我现在的计划是遵循Gelman的建议并“强调”采样分布。我会教书,但我会向学生保证,这只是一种仅供参考的主题,不会出现在考试中(除非作为奖励问题?!)。但是,我真的很想听听人们使用的其他方法。

4
自我学习与受教教育?
对于程序员,有一个类似目的的问题。这个问题有一些很好的答案,但是总的主题似乎是,如果不自学,您将无所适从。 显然,编程和统计之间存在一些主要区别-使用编程,您实际上只是在学习一些基本逻辑,然后重复应用它。新语言都使用相同的基本概念。自我学习可以让您学习更高级的概念,并变得更有效率。这种东西很难教。 统计数据完全不同。应用所涉及的逻辑很容易-因为通常有人设计了该方法。实际上,该方法通常是大学所教授的大部分方法。但是统计信息确实比这更深入,并且涉及一些真正的高级概念。甚至很难找到这些概念,如果您所学的只是应用统计学,更不用说理解它们了(尽管我想知道这可能是由于该领域的行话造成的)。另外,我发现编程中的自学涉及阅读许多简短的文章/博客以向您介绍新概念,而有关统计的可访问文章几乎总是针对初学者,因此对于像这样的新手而言毫无用处。我。 因此,问题是:自学是否比大学教育更适合统计学?哪种自我学习方法可行?任何以前为人们服务的例子都将受到欢迎。 (这可能应该是社区Wiki,但是我没有看到任何复选框)

2
良好的在线资源,其中包含有关在各种条件下绘制两个数值变量之间关系的图形的提示
内容: 一段时间以来,我获得了一系列启发式方法,可以有效地绘制两个数字变量之间的关联。我想大多数处理数据的人都会有一套相似的规则。 此类规则的示例可能是: 如果变量之一正偏,请考虑在对数刻度上绘制该轴。 如果数据点很多(例如n> 1000),则采用其他策略,例如使用某种形式的部分透明性或对数据进行采样; 如果变量之一属于有限数量的离散类别,请考虑使用抖动或向日葵图; 如果存在三个或更多变量,请考虑使用散点图矩阵; 拟合某种形式的趋势线通常很有用; 将绘图字符的大小调整为样本大小(对于较大的n,使用较小的绘图字符); 等等。 题: 我希望能够引导学生访问一个网页或网站,该网站或网站解释了这些技巧和其他技巧,以有效地绘制两个数值变量之间的关联(也许带有示例)。 互联网上有没有做得很好的页面或站点?

2
有关改善概率和统计速查表的建议
内容: 为了构建我在概率论和静力学中遇到的中心部分,我创建了一个参考文档,重点关注数学要点(可在此处获得)。 通过共享该文档,我希望为统计专业的学生提供有关这些主题的研究生课程所教授的核心材料的综合摘要。虽然主要用作教学资源,但人们可能还会发现它作为个人参考很有用,例如,查找分布关系或常见PDF的插图。我还会维护一个包含更新和修复的 页面。反馈总是倍受赞赏。 题: 您最喜欢用来统计灵感的统计速查表,参考书或食谱是什么? 是什么帮助您构建了该领域的知识? 从长远来看,我的计划是使用R示例来丰富此文档(或创建一个单独的文档),以弥合理论与实践之间的鸿沟。您认为这是有价值的扩展吗?
22 teaching 

12
负偏度分布的真实示例
受到“ 常见分布的真实示例 ”的启发,我想知道人们使用哪些教学示例来显示负偏度?教学中使用了许多对称或正态分布的“规范”示例-即使身高和体重这样的分布无法通过更严格的生物学检查而幸免!血压可能接近正常。我喜欢天文学的测量误差-具有历史意义,从直觉上讲,它们不太可能朝一个方向倾斜,而小的误差比大的误差更大。 关于正偏度的常见教学示例包括人们的收入。待售二手车的里程;心理学实验中的反应时间;房价 保险客户的事故索赔数量;一个家庭中孩子的数量。它们的物理合理性通常源于低于(通常为零)的界限,低值是合理的,甚至很常见,但众所周知,却会出现很大的值(有时高出几个数量级)。 对于负偏斜,我发现很难给出年轻观众(高中生)可以直观理解的清晰生动的示例,这也许是因为较少的现实生活分布具有明确的上限。我在学校教的一个不好的例子是“手指数”。大多数人有十个人,但有些人在一次事故中丧生一个或多个。结果是“ 99%的人的手指数高于平均数”!多义性使问题复杂化,因为十不是严格的上限。由于缺少手指和多余手指都是罕见的事件,因此对于学生可能尚不清楚哪个影响占主导地位。 我通常使用高的二项式分布。但是,学生通常会发现“一批中令人满意的组件数量出现负偏斜”不如“一批中的故障组件数量呈正偏斜”这一补充事实那么直观。(这本教科书是工业主题的;我更喜欢在十二个盒子中装满裂纹和完整的鸡蛋。)也许学生觉得“成功”应该很少见。ppp 另一个选择是指出,如果呈正偏,则呈负偏,但将其置于实际情况下(“负房价呈负偏”)似乎注定会导致教学上的失败。虽然教数据转换的效果是有好处的,但首先给出一个具体的例子似乎是明智的。我更喜欢一个似乎不是人为的,负偏斜非常明确,并且学生的生活经历应该使他们意识到分布形状的人。− XXXX−X-X-X

3
首先应该教什么:概率或统计?
我刚以数学系的老师的身份加入。一家知名机构。我将在本科阶段教授“概率与统计”课程。该机构已经为该课程制定了课程提纲,对此我不太满意。在该课程表中,首先涵盖了统计信息,也缺少估计部分。我一直认为,在教授统计学之前,应该先教概率基础。有人可以对此发表意见吗?同样,对于在此课程中应涵盖的主题的建议也深表感谢。
19 teaching 

6
如何在不到10分钟的时间内解释针对青少年的假设检验?
一年多来,我一直在提供一个小时的“统计学趣味”课程。每次我有一群不同的孩子过来,我给他们上课。 本课程的主题是,我们进行了一项实验,为10个孩子(喜欢喝可口可乐)提供了两个(未标记)杯子,一个杯子装有可口可乐,一个杯子有百事可乐。要求孩子们根据口味和气味检测出哪杯可乐饮料。 然后,我需要向他们解释如何确定孩子是否在猜测,或者他们(或至少有足够的孩子)是否真的有能力尝尝差异。10个成功中有10个足够好吗?十分之七呢? 即使给这堂课上了数十次(有不同的变化),我仍然不知道我如何以大多数班级都能理解的方式来理解这个概念。 如果您对如何以简单(!)和直观的方式来解释假设检验,无效假设,替代假设,拒绝区域等的概念有任何想法,我想知道如何。


5
我们应该在应用统计学课程中教授峰度吗?如果是这样,怎么办?
至少在直观的基础上,可以相对较好地定义中心趋势,散布和偏斜;这些事物的标准数学度量也相对符合我们的直觉概念。但是峰度似乎有所不同。这非常令人困惑,并且与关于分布形状的任何直觉都不太匹配。 应用环境中峰度的典型解释是使用Microsoft Excel [ 1 ]从商业和管理应用统计中摘录的内容:[1][1]^{[1]} 峰度是指分布的峰值程度或相反的平坦度。如果尾部的数据值多于正态分布的期望值,则峰度为正。相反,如果尾部的数据值少于正态分布中的预期,则峰度为负。除非您至少有四个数据值,否则Excel无法计算此统计信息。 除了“峰度”和“峰度过高”(在本书中,通常使用前者指其他作者称为后者)之间的混淆之外,还用“峰度”或“平坦度”来解释。然后将注意力转移到尾部有多少个数据项上。同时考虑“峰”和“尾”是必要的— Kaplansky [ 2 ][2][2]^{[2]}1945年抱怨说,当时的许多教科书错误地指出峰度与分配峰相比正常分布峰有多高有关,而没有考虑尾部。但是显然必须同时考虑峰的顶部和尾部的形状,这使得直觉更难掌握,上面引述的摘录通过将尾部的峰度和重度相提并论,好像这些概念相同,从而跳过了这一点。 此外,对峰度的这种经典的“峰尾”解释仅适用于对称和单峰分布(实际上,该文本中所示的示例都是对称的)。然而,解释峰度的“正确”通用方法,无论是用“峰”,“尾巴”还是“肩”,都已经争议了数十年。[ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ][2][3][4][5][6][2][3][4][5][6]^{[2][3][4][5][6]} 是否有一种直观的方法来在应用的环境中教授峰度,当采用更严格的方法时不会出现矛盾或反例?在这类应用数据分析课程中,峰度甚至在数学统计课中都什至是一个有用的概念吗?如果分布的“峰值”是一个直观上有用的概念,我们是否应该通过L矩[ 7 ]来教授它?[7][7]^{[7]} [1][1][1] Herkenhoff,L.和Fogli,J.(2013)。使用Microsoft Excel进行业务和管理的应用统计。纽约,纽约:施普林格。 [2][2][2]卡普兰斯基,I。(1945)。“有关峰度的常见错误”。 美国统计协会杂志,40(230):259。 [3][3][3]达林顿,理查德·B(1970)。“峰变真的是'峰顶'吗?”。美国统计学家 24(2):19-22 [4][4][4]摩尔,JJA。(1986)“峰度的含义:达林顿重新审查”。美国统计学家 40(4):283–284 [5][5][5] Balanda,Kevin P.和MacGillivray,HL(1988年)。“ 峰度:评论综述”。美国统计学家 42(2):111–119 [6][6][6] DeCarlo,LT(1997)。“ 关于峰度的含义和使用 ”。心理方法,2(3),292。芝加哥 [7][7][7] Hosking,JRM(1992)。“矩还是L矩?比较两个分布形状量度的示例”。美国统计学家46(3):186–189

8
对于好的本科统计入门书有什么建议吗?
我希望你能给我一些建议。我在一所非常多样化的大学(由少数群体组成)中任教,而学生大多是心理学专业。大多数学生都是刚从高中毕业的学生,​​但其中一些是年龄较大的40岁以上的回国学生。大多数学生都存在动机问题和对数学的反感。但是我仍在寻找一本涵盖基本课程的书:从描述性到ANOVA一直到实验方法范围内的采样,测试和测试。该部门要求我在课堂上使用SPSS,但我喜欢在Excel等电子表格中进行分析的想法。 ps其他老师使用一本我不喜欢的书,因为它广泛依赖于计算公式。我发现使用这些计算公式-而不是更直观,计算量更大的与合理和基本算法一致的公式-直观,不必要和令人困惑。这是我所引用的《行为科学统计学要旨》,第7版,纽约州立大学弗雷德里克·J·格雷夫特分校,布罗克波特Larry B. Wallnau纽约州立大学,布罗克波特ISBN-10:049581220X谢谢您的阅读!

2
为什么将标准偏差定义为方差的平方根而不是N的平方和的平方根?
今天我教了一门统计学入门课,一个学生问我一个问题,在这里我改写为:“为什么标准偏差定义为方差的平方根而不是N的平方和的平方根?” 我们定义总体方差:σ2=1N∑(xi−μ)2σ2=1N∑(xi−μ)2\sigma^2=\frac{1}{N}\sum{(x_i-\mu)^2} 和标准差:。σ=σ2−−√=1N√∑(xi−μ)2−−−−−−−−−−√σ=σ2=1N∑(xi−μ)2\sigma=\sqrt{\sigma^2}=\frac{1}{\sqrt{N}}\sqrt{\sum{(x_i-\mu)^2}} 我们可能对的解释是,它给出了总体中单位与的总体平均值的平均偏差。σσ\sigmaXXX 但是,在sd的定义中,我们将平方和的平方根除以。学生提出的问题是,为什么我们不划分平方庙的开方代替。因此,我们得出了竞争公式:学生认为,这种公式看起来更像由平均通过时分割比一个“平均”偏差如在。N−−√N\sqrt{N}NNNσnew=1N∑(xi−μ)2−−−−−−−−−−√.σnew=1N∑(xi−μ)2.\sigma_{new}=\frac{1}{N}\sqrt{\sum{(x_i-\mu)^2}}.N−−√N\sqrt{N}σσ\sigma 我认为这个问题并不愚蠢。我想给学生一个答案,那就是说sd 定义为方差的平方根,即均方根偏差。换句话说,为什么学生应该使用正确的公式而不遵循她的想法? 该问题与此处提供的旧主题和答案有关。那里的答案有三个方向: σσ\sigma是均方根(RMS)偏差,而不是与平均值的“典型”偏差(即)。因此,它的定义有所不同。σnewσnew\sigma_{new} 它具有良好的数学特性。 此外,sqrt将使“单位”恢复到原始大小。但是,也是如此,它被N除以。σnewσnew\sigma_{new}NNN 第1点和第2点都是支持sd作为RMS的参数,但是我看不到反对使用σnewσnew\sigma_{new}。怎样说服入门级学生使用均方根平均距离σσ\sigma与均值?


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.