我们正在调查贝叶斯统计检验,并且遇到一种奇怪的现象(对我来说至少是这样)。
考虑以下情况:我们有兴趣测量哪个人口A或B具有较高的转化率。对于健全性检查,我们将设置,也就是说,两组转换的可能性相等。我们使用二项式模型生成人工数据,例如
然后,我们尝试使用贝叶斯beta二项式模型估计以便获得每种转换率的后验,例如
我们的测试统计量是通过蒙特卡洛通过计算来计算的。
令我惊讶的是,如果,则。我的想法是,随着样本大小增加,它将以0.5为中心,甚至收敛到0.5 。
我的问题是,为什么 当时?p 甲 = p 乙
这是一些Python代码来演示:
%pylab
from scipy.stats import beta
import numpy as np
import pylab as P
a = b = 0.5
N = 10000
samples = [] #collects the values of S
for i in range(5000):
assert a==b
A = np.random.binomial(N, a); B = np.random.binomial(N, b)
S = (beta.rvs(A+1, N-A+1, size=15000) > beta.rvs(B+1, N-B+1, size=15000)).mean()
samples.append(S)
P.hist(samples)
P.show()
R