受彼得·唐纳利(Peter Donnelly)在TED上的演讲的启发,他在演讲中讨论了某种图案出现在一系列抛硬币中需要多长时间,我在R中创建了以下脚本。给定两种图案“ hth”和“ htt”,计算在您击中其中一种模式之前平均需要花费多长时间(即,掷多少硬币)。
coin <- c('h','t')
hit <- function(seq) {
miss <- TRUE
fail <- 3
trp <- sample(coin,3,replace=T)
while (miss) {
if (all(seq == trp)) {
miss <- FALSE
}
else {
trp <- c(trp[2],trp[3],sample(coin,1,T))
fail <- fail + 1
}
}
return(fail)
}
n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))
hth <- c('h','t','h')
htt <- c('h','t','t')
set.seed(4321)
for (i in 1:n) {
trials[i,] <- c(hit(hth),hit(htt))
}
summary(trials)
摘要统计如下,
hth htt
Min. : 3.00 Min. : 3.000
1st Qu.: 4.00 1st Qu.: 5.000
Median : 8.00 Median : 7.000
Mean :10.08 Mean : 8.014
3rd Qu.:13.00 3rd Qu.:10.000
Max. :70.00 Max. :42.000
在演讲中,我们解释了两种方式的平均抛硬币次数将有所不同。从我的模拟中可以看出。尽管看了几次演讲,我还是不太明白为什么会这样。我知道'hth'会重叠,并且直觉上我认为您会比'htt'早点击打'hth',但是事实并非如此。如果有人可以向我解释这一点,我将非常感激。