使用计算机模拟以更好地理解研究生级别的统计概念


11

您好,我正在修读统计学的研究生课程,并且我们涵盖了测试统计和其他概念。

但是,我通常能够运用公式并就事物的工作原理形成某种直觉,但我常常感到,如果我通过模拟实验来支持研究,那么我将对眼前的问题有更好的直觉。

因此,我一直在考虑编写简单的模拟,以更好地理解我们在课堂上讨论的一些概念。现在我可以用说Java来:

  1. 产生具有正常均值和标准差的随机总体。
  2. 然后取一个小样本,尝试尝试凭经验计算Type-I和Type-II错误。

现在我的问题是:

  1. 这是发展直觉的合法方法吗?
  2. 是否有执行此操作的软件(SAS?,R?)
  3. 统计学是一门处理此类编程的学科吗:实验统计?,计算统计?模拟?

1
我一直在使用模拟来尝试更好地了解正在发生的事情。您几乎可以使用任何编程语言或统计程序来进行这些类型的实验(甚至是Excel)。
约翰·

1
+1,模拟和数字是建立直觉有用的技术中的2种。我通常使用它们来帮助他人和我自己理解事物。简历问题有很多答案,都用模拟人生来说明。如果您需要一些链接,我可以轻松列出一些自己以模拟方式使用过的答案。您也可以按照这种方式在此处问简历。例如,“我试图理解_____,但是我遇到了困难,有人可以提供一个含SIM卡的说明,以使其更清晰吗?” 或者,“我做过这个模拟游戏,它表明它可以这样工作,对吗?”
gung-恢复莫妮卡

4
为了满足该站点的高标准和期望,我在会从中受益的每个答案中都使用了模拟(以及理论推导和插图)。我最近的大部分答复将包括某种形式的模拟,尤其是几乎所有带有r标签的问题的答复。例如,如果您有兴趣,可以从搜索页面中浏览它们。
ub

2
通过查看@whuber的答案,您会发现很多很棒的东西。由于我的答案(和编程能力)往往不太复杂,因此他们可能迈出了第一步。我使用一个sim来表明,很难在此处使用模型拟合来选择GLiM中的最佳链接:logit和probit模型之间的区别。在这里,我使用一个sim卡来说明在t检验中,随着组大小变得不相等,功效如何下降:一个人应该如何解释来自不同样本大小的均值比较
gung-恢复莫妮卡

2
这个CV问题:统计模拟的解释,也可能对该线程的读者感兴趣。
gung-恢复莫妮卡

Answers:


7

我喜欢您的问题,但对2和3没有具体答案?我想像SAS之类的软件包(广泛地说是SAS产品,而不仅仅是SAS / STAT)可能具有促进仿真的工具,但我不能肯定地说。我认为这种事情不适合作为数学或统计学的分支。

现在问题1是我想重点关注的问题。模拟可以帮助学习所有级别的统计信息,并且通常可以帮助进行统计研究。确实,有一些期刊侧重于模拟和计算。甚至FDA也意识到模拟在设计临床试验和帮助预测结果方面的重要性。

1960年代,朱利安·西蒙(Julian Simon)教授以模拟为动力的入门统计学。尽管引起争议,他后来声称自己在Efron之前进行了重采样(排列和引导)。他在1969年使用这些思想出版了一本书。它当然缺乏理论,只是一种教学辅助手段,并不是统计估计的新方法。他没有开发埃夫隆(Efron)随附或之后的任何数学特性。

我认为,对于介绍性统计资料,进行仿真以演示抽样分布,展示中心极限定理是如何产生的,而通过梅花形的物理仿真演示中心极限定理的DeMoivre-Laplace版本非常有用。

有时它会增强直觉。我认为,即使对于像Paul Erdos这样的数学家来说,Monty Hall问题也令人困惑,而且似乎是自相矛盾的。但是模拟游戏通常非常令人信服。我认为这有很多可能是违反直觉的,模拟可以解决问题。

1978年,当我在极值理论领域攻读博士学位时,我有一个直觉的想法就是要证明的极限定理。我在数学上苦苦挣扎。然后,我决定模拟随机过程,然后模拟“确认”了我的结果。这使我有信心进行证明。

因此,即使在研究生层次上,以及超出模拟范围,也可以通过两种方式使用。

  1. 按照问题1的建议帮助发展直觉

  2. 确认我在论文中所做的直觉


我发现有人在这里解决了SAS和R中的Monty Hall问题sas-and-r.blogspot.com/2010/01/…-尽情享受
user1172468 2012年

斯坦福大学的苏珊·福尔摩斯(Susan Holmes)几年前在其网站上放了Monty Hall游戏模拟。感谢您提醒我们@ user1172468,许多人可以并且很可能正在将模拟放在理论网站上。
Michael R. Chernick

R的蒙蒂·霍尔(Monty Hall)问题(非常容易理解
vasili111 '19

8
  1. 是。毕竟这与您的直觉有关。
  2. R会适合你的。如果您已经知道Java(或其他任何“标准编程语言”),那么编码对您来说将非常容易。
  3. 计算统计涉及用于实现统计方法的算法的设计,可能与您在此描述的最接近。

玩得开心!


我认为您的回答令人称赞。我对1给出了详细的答案,而您对2和3给出了更明确的答案。您似乎在几分钟之内就回答了问题。我们可能重叠了。无论如何,您给了2个很好的答案,而我给了他们好评!
Michael R. Chernick

感谢您的支持!看来您在回答问题上比我领先一步。:)
usεr11852

继续回答。我要休息一下。我的每日代表次数已经快达到上限了。
Michael R. Chernick

伙计们,我认为两个答案都很好。我选择@Michael的答案是因为我只能选择一个正确的答案,而且我觉得可以解决当前的一些更基本的问题。
user1172468 2012年

1
@ user1172468您确实不需要解释,但是您做得很好。
Michael R. Chernick

4

R的TeachingDemos程序包源自与您类似的思考过程,试图以不同的方式可视化和理解概念。软件包中的某些功能使用仿真来帮助您理解一些关键概念。开发版本(R-forge,但不在CRAN上)包括功能“ simfun”,可用于创建仿真功能以进一步帮助仿真。



1
还列出了其他有关R的统计信息的教学链接:cran.r-project.org/web/views/TeachingStatistics.html
vasili111 '19
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.