Questions tagged «teaching»

对于有关概率和统计学教学的任何问题。





25
查找免费可用的数据样本
我一直在研究一种用于分析和解析数据集的新方法,以识别和隔离总体中的子组,而无需预知任何子组的特征。尽管该方法对于人工数据样本(即专门为识别和隔离总体子集而创建的数据集)足够有效,但我想尝试使用实时数据对其进行测试。 我正在寻找的是免费的(即非机密,非专有的)数据源。优选地,包含双峰或多峰分布或明显由多个子集组成的子集不能通过传统方式轻易地拉开。我将在哪里找到此类信息?

29
教学示例:相关并不意味着因果关系
有句老话:“关联不等于因果关系”。在教书时,我倾向于使用以下标准示例来说明这一点: 丹麦的鹳数量和出生率; 美国牧师的人数和酗酒; 在20世纪初,人们注意到“收音机数量”与“疯人院的人数”之间有很强的相关性。 我最喜欢的是:海盗导致全球变暖。 但是,我没有这些示例的任何参考,虽然很有趣,但它们显然是错误的。 有人还有其他好的例子吗?



3
为什么我们在不必线性回归时非常关心正态分布误差项(和同方差)?
我想每次听到有人说残差和/或异方差的非正态性违反OLS假设时,我都会感到沮丧。要估计 OLS模型中的参数,高斯-马尔可夫定理都不需要这些假设。我认为在OLS模型的假设检验中这有多重要,因为假设这些事情为我们提供了t检验,F检验和更通用的Wald统计量的简洁公式。 但是,没有它们就可以进行假设检验。如果仅去除同方差,我们可以轻松计算出健壮的标准误差和聚类标准误差。如果我们完全放弃正态性,我们可以使用自举,并为误差项,似然比和拉格朗日乘数检验指定另一个参数规范。 我们以这种方式进行授课只是一种耻辱,因为我看到很多人都在为自己不必首先遇到的假设而苦苦挣扎。 当我们有能力轻松应用更强大的技术时,为什么我们如此强调这些假设?我缺少重要的东西吗?

9
微小的(真实的)数据集,用于课堂教学中的例子?
我认识的老师在讲授入门课时,往往会发明一些数字和一个故事,以例证他们所教的方法。 我更希望用真实的数字讲一个真实的故事。但是,这些故事需要与非常小的数据集相关联,从而可以进行手动计算。 对于此类数据集的任何建议将非常受欢迎。 小型数据集的一些示例主题: 相关/回归(基本) 方差分析(1/2方式) z / t测试-一个/两个未配对的样本 比例比较-双向表

5
学习统计思维的好游戏?
有没有能让玩家“像统计学家一样思考”的游戏? 例如,lightbot让您“像程序员一样思考”(以非常基本的方式)。是否有为娱乐或教学而设计的游戏,可以帮助您熟悉相关性,p值,最小二乘法,方差,各种概率分布,回归均值等基本概念。 一个例子就是这种相关性猜测游戏。 (我之所以问是因为我正在考虑开发这样的应用程序,并且试图广泛了解现有的工作内容)

10
您最喜欢外行对一个困难的统计概念的解释是什么?
我真的很喜欢听到对复杂问题的简单解释。您最喜欢哪种比喻或轶事来解释一个困难的统计概念? 我最喜欢的是穆雷(Murray)对酒鬼和她的狗的协整解释。默里(Murray)解释了两个随机过程(一个流浪的醉汉和她的狗,奥利弗(Oliver))如何能够具有单位根,但由于它们的联合第一差异是固定的,因此仍然是相关的(共同集成)。 喝醉了的人从酒吧出发,以随意行走的方式漫无目的地游荡。但是她周期性地发出“奥利弗,你在哪里?”的声音,奥利弗打断了他漫无目的的徘徊以吠叫。他听见她的话。她听到他的声音。他想:“哦,我不能让她离得太远;她会把我拒之门外。” 她想:“哦,我不能让他离得太远;他会在半夜用吠叫叫醒我。” 每个人都评估彼此之间有多远,并努力部分缩小该差距。


3
手动计算逻辑回归95%置信区间与在R中使用confint()函数之间为什么会有区别?
亲爱的大家-我注意到我无法解释的怪事,可以吗?总之:在logistic回归模型中计算置信区间的手动方法和R函数confint()得出不同的结果。 我一直在研究Hosmer&Lemeshow的Applied Logistic回归(第二版)。在第3章中,有一个计算比值比和95%置信区间的示例。使用R,我可以轻松地重现模型: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

10
如何教那些担心统计学的学生?
我将在本学期帮助医学生教授统计学。 我听到过许多恐怖的故事,这些故事使学习统计资料的学生感到恐惧。 有人可以建议如何应对这种恐惧吗?(要么链接到正在讨论此问题的人,要么根据您的经验提供建议)
33 teaching 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.