Answers:
这个结果令人着迷的是它看起来有多大的相关系数分布。是有原因的
假设是具有零相关性和两个变量的共同方差的双变量正态。绘制一个iid样本。它是公知的,并且很容易地建立几何(如费希尔一个世纪以前),该样品的相关系数的分布σ 2(X 1,ÿ 1),... ,(X Ñ,ÿ Ñ)
是
(在这里,像往常一样,和是抽样平均值和和是无偏方差估计量的平方根。) 是β函数,为此ˉ ý小号X小号ÿ乙
为了计算,我们可以利用绕着生成的线绕旋转时的不变性,以及相同旋转下样本分布的不变性,并选择作为其分量总和为零的任何单位向量。 一个这样的向量与成比例。其标准偏差为[R Ñ(1 ,1 ,... ,1 )ÿ 我/ š Ŷ v = (ñ - 1 ,- 1 ,...
因此,必须具有与以下相同的分布
因此,我们需要做的是重新缩放以找到的分布:
对于。公式(1)表明这与问题相同。
不完全相信吗?这是对该情况进行100,000次模拟的结果(其中,其中分布均匀)。
第一直方图的相关系数,而第二直方图的相关系数对随机选择的向量对于所有迭代均保持固定。 他们都是统一的。右侧的QQ图确认这些分布基本相同。(x i,v i),i = 1 ,… ,4 )v i
这R
是生成绘图的代码。
n <- 4
n.sim <- 1e5
set.seed(17)
par(mfrow=c(1,3))
#
# Simulate spherical bivariate normal samples of size n each.
#
x <- matrix(rnorm(n.sim*n), n)
y <- matrix(rnorm(n.sim*n), n)
#
# Look at the distribution of the correlation of `x` and `y`.
#
sim <- sapply(1:n.sim, function(i) cor(x[,i], y[,i]))
hist(sim)
#
# Specify *any* fixed vector in place of `y`.
#
v <- c(n-1, rep(-1, n-1)) # The case in question
v <- rnorm(n) # Can use anything you want
#
# Look at the distribution of the correlation of `x` with `v`.
#
sim2 <- sapply(1:n.sim, function(i) cor(x[,i], v))
hist(sim2)
#
# Compare the two distributions.
#
qqplot(sim, sim2, main="QQ Plot")
RA Fisher,无限大样本中相关系数值的频率分布。 Biometrika,10,507参见第3节(引自统计肯德尔的先进理论,第5版,部分16.24)。
我想建议通过贝叶斯定理直接计算的MVUE来获得Z的pdf的方法,尽管它既少又复杂。
由于和,所以是联合完全足够的统计量,因此 是这样的:
现在使用贝叶斯定理,我们得到
分母可以用封闭形式编写,因为,彼此独立。
要获得分子的封闭形式,我们可以采用以下统计信息:
这是的均值和样本方差,它们彼此独立,也独立于。我们可以用来表达这些。
,
我们可以在,
由于 ,我们可以得到它的封闭形式。请注意,这仅适用于,它将限制为。
因此,将它们放在一起,指数项将消失,而您会得到,
由此,我们可以使用变换获得的pdf 。
顺便说一下,MVUE像这样: 而,如果将为1
我不是英语母语人士,可能会有一些尴尬的句子。我正在用霍格的数学统计入门教材独自学习统计。因此,可能存在一些语法或数学上的概念性错误。如果有人纠正它们,将不胜感激。
感谢您的阅读。