微小的(真实的)数据集,用于课堂教学中的例子?


43

我认识的老师在讲授入门课时,往往会发明一些数字和一个故事,以例证他们所教的方法。

我更希望用真实的数字讲一个真实的故事。但是,这些故事需要与非常小的数据集相关联,从而可以进行手动计算。

对于此类数据集的任何建议将非常受欢迎。

小型数据集的一些示例主题:

  • 相关/回归(基本)
  • 方差分析(1/2方式)
  • z / t测试-一个/两个未配对的样本
  • 比例比较-双向表

您可以定义“小”吗?“手动”计算是否包括使用计算器?
David LeBauer 2011年

嗨,大卫-计算器很好-但想法是不要有太多数字(因为所有数字都需要写在黑板上)
Tal Galili

Answers:


26

数据和故事图书馆是一个“这说明使用的基本统计方法,数据文件和故事的网上图书馆”。

该站点似乎满足您的需求,您可以在其中搜索特定的数据集。


大卫,您好-您链接到的网站确实很棒-谢谢。
Tal Galili

当前不可用的服务(截至2016
Felipe Almeida

@FelipeAlmeida我刚刚访问了该网站;请再次检查,也许是在其他计算机/设备上
David LeBauer

@DavidLeBauer您是否尝试过单击“列出所有主题”,然后选择一种方法?在此处
Felipe Almeida

1
@FelipeAlmeida我明白了。我与该网站的维护者交谈,他说:“很快就会在dasl.datadesk.com上寻求新的,更现代的,更好的DASL。”
David LeBauer '16

23

DJ Hand,F。Daly,AD Lunn,KJ McConway和E. Ostrowski有一本书叫做“小型数据集手册”。NCSU的统计部门在这里以电子方式发布了本书的数据集。

上面的网站仅提供数据;您需要阅读该书才能使故事背后的数字,也就是任何您可以从数据集标题中搜集到的故事。但是,它们很小,它们是真实的


这些尺寸恰到好处。您可以通过在Google Scholar中搜索“小型数据集手册”来查看该书-您可以在Google图书中查看其中的一部分。
Felipe Almeida

给定的链接已损坏。请更新链接。谢谢
MYaseen208

13

对于两张桌子,我喜欢泰坦尼克号乘客的性别和生存数据:

       | Alive  Dead | Total
-------+-------------+------
Female | 308    154  |  462
Male   | 142    709  |  851
-------+-------------+------
Total  | 450    863  | 1313

有了这些数据,就可以讨论诸如卡方检验的独立性和关联度量之类的事情,例如相对比率和优势比。例如,女性乘客生存的可能性是男性乘客的约4倍。同时,男性乘客死亡的可能性是女性乘客的2.5倍。但是,生存/死亡的几率总是10。


好主意沃尔夫冈,我没想到。
Tal Galili

(发布的社区Wiki与所有其他答案一致。)
Glen_b 2015年



4

可能不需要回答,这是一个显而易见的答案,但是对于相关性或线性回归,Anscombe的四重奏是一个合理的选择。尽管这不是一个包含真实数据的真实故事,但我认为这是一个简单的示例,可以合理地适合您的标准。


很好的例子安迪-我今天学到了一些新东西:)
塔尔·加利里


2

一篇名为《教学统计的资源发现》的不错的文章阐明了该主题。


刚读完大部分论文(我略读了一部分)-的确是对情况的很好回顾。看到未来的发展将会很有趣……
Tal Galili 2013年

2
您是否可以在此处添加关键点或给出摘要?该链接可能在某个时候失效,并且还可以帮助读者知道是否想进一步搜索该链接而不必单击它。
gung-恢复莫妮卡

1

https://tuvalabs.com

我相信您早已找到了想要的东西,但是对于遇到线程的其他人来说,TuvaLabs是提供课堂数据集的不错来源。它可以管理数据集,故事,描述,小练习和可视化功能,您也可以请求数据集。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.