John Kerrich投币数据


12

任何人都可以建议从哪里获得约翰·科里希(John Kerrich)在第二次世界大战期间进行的10,000次硬币翻转的结果(即,所有10,000次正面和反面)?


1
考虑到他当时被关押在纳粹监狱,我想知道他是否有足够的纸来记录所有1万个结果,或者他是否只写下了摘要值。
Corone 2013年

6
@Corone 10K结果可以很容易地使用点和条形码(例如,||||..|....||.|..||.等)记录在一张标准纸上。可以使用(例如)十六进制压缩。在前面的示例中,|设为1且.为0,则十六进制表示为f21a6。通过书写小的但可见的字符,我可以轻松地将50个这样的字符放入一行书写中,并在一张纸上容纳50行,从而表示50 * 50 * 4 = 10K结果的序列。
ub

2
@whuber哈哈,是的,我在发表评论后开始思考类似的事情。我怀疑在十六进制之前会像现在这样突然出现十六进制,尽管八进制仍会给您带来机会。我还是给了它一个机会,单是点和破折号就可以使我在一张纸上得到100左右,因此,如果他两面都使用10K,就差不多了。也许这就是为什么他停在10K的原因!
Corone

一个纳粹监狱,是的,但是在丹麦,这不是一个灭绝营……
kjetil b halvorsen

@kjetilbhalvorsen-实际上是在哈尔德的丹麦监狱营地,有丹麦护卫队等保护被拘禁者免受德国人的侵害
亨利

Answers:


13

我以前从未听说过Kerrich,这是一个奇怪的故事。Google的“概率论实验性入门”图书扫描(不包括reftt共享)似乎没有包含正文。感觉有点过时,我从图书馆里拿出了​​1950年版的副本。

我已扫描了几页有趣的页面。这些页面描述了他的测试条件,从前2000次硬币翻转获得的数据以及在一系列5000个听起来同样令人难以置信的实验(带有2个红色和2个绿色的乒乓球)中的前500个的数据。


使用Mathematica 9进行文本识别(和一些清除)后,表1的序列为2000尾(0)和头(1)。头数1014比表2中的502 + 511 = 1013多,因此识别为不完美,但看起来还不错-至少它具有正确的字符数!(欢迎敏锐的读者来纠正它。)

这是此随机游走的图形摘要,其后是数据本身。头和尾计数之间的累计差值从左到右进行,涵盖了所有2000个结果。

数字

00011101001111101000110101111000100111001000001110
00101010100100001001100010000111010100010000101101
01110100001101001010000011111011111001101100101011
01010000011000111001111101101010110100110110110110
01111100001110110001010010000010100111111011101011
10001100011000110001100110100100001000011101111000
11111110000000001101011010011111011110010010101100
11101101110010000010001100101100111110100111100010
00001001101011101010110011111011001000001101011111
11010001111110010111111001110011111111010000100000
00001111100101010111100001110111001000110100001111
11000101001111111101101110110111011010010110110011
01010011011111110010111000111101111111000001001001
01001110111011011011111100000101010101010101001001
11101101110011100000001001101010011001000100001100
10111100010011010110110111001101001010100000010000
00001011001101011011111000101100101000011100110011
11100101011010000110001001100010010001100100001001
01000011100000011101101111001110011010101101001011
01000001110110100010001110010011100001010000000010
10010001011000010010100011111101101111010101010000
01100010100000100000000010000001100100011011101010
11011000110111010110010010111000101101101010110110
00001011011101010101000011100111000110100111011101
10001101110000010011110001110100001010000111110100
00111111111111010101001001100010111100101010001111
11000110101010011010010111110000111011110110011001
11111010000011101010111101101011100001000101101001
10011010000101111101111010110011011110000010110010
00110110101111101011100101001101100100011000011000
01010011000110100111010000011001100011101011100001
11010111011110101101101111001111011100011011010000
01011110100111011001001110001111011000011110011111
01101011101110011011100011001111001011101010010010
10100011010111011000111110000011000000010011101011
10001011101000101111110111000001111111011000000010
10111111011100010000110000110001111101001110110000
00001111011100011101010001011000110111010001110111
10000010000110100000101000010101000101100010111100
00101110010111010010110010110100011000001110000111

3
别客气。我在您的扫描图像上叠加了这些数据的图,希望它可以使任何差异变得明显,但是我根本找不到任何差异。无论有没有错误,Kerrich算错还是我只是找不到错误,但在数据张贴在这里无论如何都是他的表1的准确的文本渲染
whuber

4

演示显示了设定的抛掷间隔数据。它还引用了Kerrich的主要资料。


2
该演示文稿中(摘要)数据的来源是Freedman,Pisani和Purves Statistics(任何版本)。但是,它仅是摘要,而不是此处要求的所有结果的说明。凯里希(Kerrich)于1946年在一本小书中发表了他的研究结果。谷歌已经数字化了它
ub

就像我说的那样,它具有“间隔时间”的数据,演示文稿引用了Kerrich的专着,他在那里发表了他的研究结果。我不知道Kerrich是否发布了他的每一次掷球清单。认为这至少比整体比例有用。

@whuber:是的,那是演讲中提到的专着。它的可用性似乎有限。有没有人找到PDF文件?

2

克里斯·怀尔德(George Seber)在《机会遭遇:数据分析和推理的第一门课》一书中提到了另一种Kerrich,该书在第4章(可以从此页面下载补充内容)中说,数据已发布在Kerrich [1964]中, Freedman [1991年,表1,第1页。248]。Kerrich的书很可能是《概率论》的实验性介绍,而Freedman就是已经提到的同一本教科书。我怀疑1964年的专着是否会比1946年的专着包含更多数据。


2

可以从亚马逊购买那本Kerrich的书,但是报价相当高!

更好的选择是https://openlibrary.org。
您需要在此处注册一个帐户,然后安装Adobe Digital Editions才能阅读该书。(似乎没有其他程序可以做,下载的书具有DRM和数字限制管理功能)。然后,您可以下载(“借阅”)这本书。我正在阅读。我想我可以将页面的屏幕副本与结果一起使用,并在上面使用ocr。为以后 ...

(不,我没有读完这本书,似乎只给出了前2000次抛掷,但是有很多不同的桌子,上面有投掷摘要。还有一些其他实验的桌子,例如从骨灰盒里取球) ,本着同样的精神。


3
尚不清楚您是否注意到Bill Bradley的答案中此线程中已经提供了前2000个单个结果。这本书出现在Google图书中;我在另一个评论中提供了一个链接。目前,Google链接到除亚马逊以外的其他书商,在这些书中,报价(包括运费)要便宜得多。
ub

谢谢,我注意到上面有2000年的论文,但希望我能在本书中找到更多的东西。好像没有。我无法通过Google图书阅读该书,也许访问取决于地理位置?顺便说一下,我现在从openlibrary退还了我的贷款,所以其他人可以尝试...
kjetil b halvorsen

1
当此线程出现时,我尝试了相同的操作,但结果相同。:-(我并不是要暗示我们实际上可以在Google图书上阅读该版本:它只是可搜索的。GB的主要价值(至少在Google更改政策之前)在于提供了指向我们购买地点的链接。
ub

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.