在研究自给自足的过程中,我遇到了您的问题,因为我也想了解以下直觉:从我收集的信息中,这就是我的想法(让我知道您的想法,如果我犯了任何错误等)。
令为来自均值θ > 0的泊松分布的随机样本。X1,…,Xnθ>0
我们知道对于θ是足够的统计量,因为给定T (X)的X 1,... ,X n的条件分布没有θ,换句话说,不是取决于θ。T(X)=∑ni=1XiθX1,…,XnT(X)θθ
现在,统计学家知道的是X 1,... ,X ñ 我。我。d 〜 P ö 我小号小号ø Ñ (4 ),并创建ñ = 400从该分布的随机值:A X1,…,Xn∼i.i.dPoisson(4)n=400
n<-400
theta<-4
set.seed(1234)
x<-rpois(n,theta)
y=sum(x)
freq.x<-table(x) # We will use this latter on
rel.freq.x<-freq.x/sum(freq.x)
对于统计学家创建的值,他取其总和并向统计学家B询问以下内容:AB
“我有这些样本值从泊松分布中提取。知道∑ n i = 1 x i = y = 4068时,您能告诉我有关该分布的什么信息?”x1,…,xn∑ni=1xi=y=4068
因此,仅知道(以及样本来自泊松分布这一事实)就足以让统计学家B说出θ?因为我们知道这是足够的统计信息,所以我们知道答案是“是”。∑ni=1xi=y=4068Bθ
为了获得关于此含义的一些直觉,让我们执行以下操作(摘自Hogg&Mckean&Craig的“数学统计简介”,第7版,练习7.1.9):
“ 决定创建一些伪观测,他将其称为z 1,z 2,… ,z n(因为他知道它们可能不等于原始x值)。他指出,独立泊松的条件概率在给定∑ z i = y的情况下,随机变量Z 1,Z 2 … ,Z n等于z 1,z 2,… ,z n是Bz1,z2,…,znxZ1,Z2…,Znz1,z2,…,zn∑zi=y
θz1e−θz1!θz2e−θz2!⋯θzne−θzn!nθye−nθy!=y!z1!z2!⋯zn!(1n)z1(1n)z2⋯(1n)zn
因为是均值的泊松分布Ñ θ。后一种分布是具有y个独立试验的多项式,每个试验都以n种互斥且穷举的方式之一终止,每种方式具有相同的概率1 / n。因此,B进行了这样的多项式实验y次独立试验,并获得z 1,… ,z n。”Y=∑Zinθyn1/nByz1,…,zn
这就是练习所指出的。因此,我们要做的就是:
# Fake observations from multinomial experiment
prob<-rep(1/n,n)
set.seed(1234)
z<-as.numeric(t(rmultinom(y,n=c(1:n),prob)))
y.fake<-sum(z) # y and y.fake must be equal
freq.z<-table(z)
rel.freq.z<-freq.z/sum(freq.z)
Zk=0,1,…,13
# Verifying distributions
k<-13
plot(x=c(0:k),y=dpois(c(0:k), lambda=theta, log = FALSE),t="o",ylab="Probability",xlab="k",
xlim=c(0,k),ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(8,0.2, legend=c("Real Poisson","Random Z given y"),
col = c("black","green"),pch=c(1,4))
θY=∑Xin
XZ|y
plot(rel.freq.x,t="o",pch=16,col="red",ylab="Relative Frequency",xlab="k",
ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(7,0.2, legend=c("Random X","Random Z given y"), col = c("red","green"),pch=c(16,4))
我们看到它们也非常相似(如预期)
So, "for the purpose of making a statistical decision, we can ignore the individual random variables Xi and base the decision entirely on the Y=X1+X2+⋯+Xn" (Ash, R. "Statistical Inference: A concise course", page 59).