Questions tagged «teaching»

对于有关概率和统计学教学的任何问题。

1
实验设计研究生课程应涵盖哪些内容?
我被要求为农学和生态学的高级研究生提议一门实验设计课程。我从未参加过这样的课程,并且惊讶地发现该课程可能更恰当地命名为“超越单向方差分析”,并且涵盖了我在农业统计学实验高级研究生课程中学习到的材料(例如RCBD,拉丁方,对比度,重复测量和协变量)。也许我对“实验设计”而不是“实验结果分析”感到困惑。 我对此类课程应包含的内容有一些想法,并希望就如何将其整合到满足学生需求的统计学课程中的反馈意见,同时为设计和相关测试的命名列表提供现代替代方案。 例如,当我教学生比较具有线性和二次函数的回归模型时,我无法想象教他们使用ANOVA来对连续变量进行分类,从而使用线性和二次对比。在第二种情况下,他们还将学习如何处理不是实验定义的离散值的因素。如果有的话,我可以比较两种方法。 如果我要教授“实验设计”课程,我真的很想强调与应用的统计模型无关的基本概念,并且这些基本概念将更广泛地转化为其他问题。这将使学生更加灵活地使用现代统计方法。 现有课程中似乎未涵盖的一些相关概念包括: 分层模型和混合模型(我以ANOVA和亲戚为例) 模型比较(例如替换对比) 使用空间模型代替块作为“因素” 复制,随机化和IID 假设检验,p-hacking和模式识别之间的差异。 通过仿真进行功率分析(例如,从仿真数据集中恢复参数), 预注册, 利用已发表的研究和科学原理中的先验知识。 目前有没有采用这种方法的课程?有没有这样关注的教科书?

2
在对学生论文进行评分时,如何使用这些数据校准具有不同慷慨程度的标记?
12名老师在教600名学生。这些老师教的12个群组的规模从40至90名学生不等,我们预计这两个群组之间会有系统的差异,因为研究生被分配给特定群组的比例不成比例,并且以往的经验表明,研究生的平均得分大大高于本科生。 老师对他们队列中的所有论文进行了评分,并给他们满分100分。 每位教师还查看了其他三位教师随机选择的一篇论文,并在100分中给了满分。每位教师的三篇论文都被另一位老师标记。因此,已经用这种方式对36篇不同的论文进行了标记,我称之为校准数据。 我还可以看到每个队列中有多少名研究生。 我的问题是: A)如何使用此校准数据来调整原始标记,以使其更公平?特别是,我想尽可能地消除过于慷慨/多余的制造商的影响。 B)我的校准数据是否合适?在本课程中获得的校准数据的有限的36个数据点中,我别无选择,并且在本学期没有选择的余地。但是,如果这种情况再次发生,我也许能够收集更多的校准数据,或者收集不同类型的校准数据。 这个问题与我问过的一个普遍问题有关: 我如何在对学生论文进行评分时最好地应对慷慨程度不同的标记的影响?。但是,这是另一回事,我不确定阅读该问题作为当前背景的有用之处,因为主要问题是我没有校准数据。

6
有什么好的例子可以向本科生展示?
我将在本学期下半学期向面向CS的本科生教授统计学。大多数参加该课程的学生没有动力去学习该学科,而只是出于主要要求而参加。我想让这个主题有趣且有用,而不仅仅是他们学习让B +通过的课程。 作为一名纯数学博士生,我在实际应用方面一无所知。我想问一些实际应用中的本科统计。我正在寻找的示例(在精神上)例如: 1)显示中心极限定理对于某些大型样本数据很有用。 2)提供一个反例,说明中心极限定理不适用(例如,遵循柯西分布的那些)。 3)使用Z检验,t检验或其他方法,说明假​​设检验在著名的现实生活示例中的工作原理。 4)显示过度拟合或错误的初始假设如何导致错误的结果。 5)展示p值和置信区间如何在(众所周知的)现实生活案例中发挥作用,以及在何处效果不佳。 6)类似地,I型,II型错误,统计功效,拒绝水平等。αα\alpha 我的麻烦是,尽管我在概率方面确实有很多示例(掷硬币,掷骰子,赌徒的废墟,mar,随机行走,三个囚犯悖论,蒙蒂霍尔问题,算法设计中的概率方法等),但我不知道在统计方面有很多规范的例子。我的意思是严肃的,有趣的例子,具有一定的教学价值,并且不是由人为地编造的,似乎与现实生活格格不入。我不想给学生错误的印象,即Z检验和t检验就是一切。但是由于我纯粹的数学背景,我没有足够的例子让课堂变得有趣和有用。因此,我正在寻求一些帮助。 我学生的水平大约是微积分I和微积分II。他们无法甚至显示标准正态分布的方差为1的定义,因为他们不知道如何评价高斯内核。因此,任何稍微理论化或动手的计算(例如超几何分布,一维随机游走中的反正弦定律)都将无法工作。我想展示一些例子,他们不仅可以理解“如何”,而且可以理解“为什么”。否则,我不确定是否会通过恐吓证明我的话。

1
当L2是用于计算后验损失的良好损失函数时,将是一个例子?
L2损失以及L0和L1损失,是在通过最小后验预期损失进行后验总结时非常常用的三个“默认”损失函数。原因之一可能是它们相对容易计算(至少对于1d分布),L0导致众数,L1导致中位数,L2导致均值。在教学时,我可以提出L0和L1是合理的损失函数(而不仅仅是“默认”)的情况,但是我正在努力解决L2是合理的损失函数的情况。所以我的问题是: 出于教学目的,当L2是用于计算最小后验损失的良好损失函数时,将是一个示例吗? 对于L0,很容易想到下注的情况。假设您已经计算出了即将到来的足球比赛的进球总数的后验,并且如果您正确地猜到了进球数而输了,那么您将下注赢钱。那么L0是一个合理的损失函数。 我的L1示例有些人为。您正在遇见一个朋友,该朋友将到达许多机场之一,然后乘汽车旅行给您,问题是您不知道哪个机场(并且因为她在空中,所以无法给您的朋友打电话)。考虑到她可能进入哪个机场的后部,在哪里放置自己的好地方,以便当她到达时她和你之间的距离变小?在这里,如果简化假设她的汽车将以恒定的速度直接行驶到您的位置,那么使预期的L1损失最小化的观点似乎是合理的。也就是说,一小时的等待是30分钟等待的两倍。

3
给初学者的建议(生物统计学入门)
我今年秋天在教我的第一堂课(生物统计学入门)。有人对更好地统计教学有什么建议吗?也许您希望您的第一任老师曾经使用过一些例子?我正在使用Pagano和Gauvreau的《生物统计学原理》。 编辑:详细信息 该课程是在线课程,每周两次,每次1.5小时。学生们将在观看幻灯片和笔迹演示时(无聊?)和一些平板电脑/笔动作(令人兴奋?)混合在一起时听我的演讲。本课是非常初学者的统计资料,主要教给生物医学工程师(本科生)和一些非统计资料研究生(护理,医学生,公共卫生等) 教学大纲: 1)什么是生物统计学? 2)概率 3)诊断测试(例如,特异性,敏感性,ROC曲线。通常在此处b / c,它使我们可以应用从概率中学到的一些知识,例如贝叶斯规则) 4)发行 5)抽样分布 6)置信区间 7)假设检验(一个样本,两个样本,比例) 8)功效和样本量计算 9)非参数方法 10)偶然性表(卡方检验,渔民检验,麦克内马尔检验,相对风险,优势比) 11)相关 主要目的是让学生学习统计推断的核心概念,例如,您如何量化“哪种药更好?”这一问题。类似的东西。 对于上面列出的部分,您是否有任何建议或警告来教他们。 例如:在推断比例时,我已经看到/听说过许多不同的方法将学生介绍给wald测验和score测验。如果教学效果不佳,学生很容易感到困惑(“为什么要使用其中两个?”,“我要使用哪个?”,“它们对我来说看起来是一样的。”)有些老师甚至不提这些名字而只是说:这样做是为了置信区间,而另一件事是进行假设检验。您将如何解决这个问题或其他类似问题?

7
用于数据可视化示例,教学和研究的数据集
我正在搜索可用于测试正在研究的多种datavis技术的现有数据集。 我知道一些资源,例如R中包含的资源(请尝试plot(Orange)或在此处查看)。 但我想向前迈出一步: 哪些是测试可视化工具的最佳现实数据集? 您在有关datavis的学术论文或教学幻灯片中使用了哪些数据集? 在现实世界中,哪一个是最好的例子来展示制图的优势?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.