的pdf

15

假设来自其中和未知 $X_1, X_2,...,X_n$ $N(\mu,\sigma^2)$ $\mu \in \mathcal R$ $\sigma^2>0$

令 S是此处的标准偏差。 $Z=\frac{X_1-\bar{X}}{S},$

可以看出具有Lebesgue pdf $Z$

f (z) = \frac{\sqrt{n} Γ (\frac{n - 1}{2})}{\sqrt{π} (n - 1) Γ (\frac{n - 2}{2})} {[1 - \frac{n z^{2}}{(n - 1)^{2}}]}^{n / 2 - 2} I_{(0, (n - 1) / \sqrt{n})} (| Z |)

$f(z)=\frac{\sqrt{n} \Gamma\left(\frac{n-1}{2}\right)}{\sqrt{\pi}(n-1)\Gamma\left(\frac{n-2}{2}\right)}\left[1-\frac{nz^2}{(n-1)^2}\right]^{n/2-2}I_{(0,(n-1)/\sqrt{n})}(|Z|)$

然后我的问题是如何获取此pdf？

问题是从示例3.3.4中的此处开始，以找到的UMVUE 。我可以理解找到UMVUE的逻辑和过程，但不知道如何获取pdf。 $P(X_1 \le c)$

我认为这个问题也涉及到这一个

非常感谢您的帮助，或指向任何相关参考文献也将适用。

self-study umvue

— 深北
source

14

这个结果令人着迷的是它看起来有多大的相关系数分布。是有原因的

假设是具有零相关性和两个变量的共同方差的双变量正态。绘制一个iid样本。它是公知的，并且很容易地建立几何（如费希尔一个世纪以前），该样品的相关系数的分布 $(X,Y)$ $\sigma^2$ $(x_1,y_1), \ldots, (x_n,y_n)$

r = \frac{\sum_{i = 1}^{n} (x_{i} - \bar{x}) (y_{i} - \bar{y})}{(n - 1) S_{x} S_{y}}

$r = \frac{\sum_{i=1}^n(x_i - \bar x)(y_i - \bar y)}{(n-1) S_x S_y}$

是

f (r) = \frac{1}{B (\frac{1}{2}, \frac{n}{2} - 1)} {(1 - r^{2})}^{n / 2 - 2}, - 1 \leq r \leq 1.

$f(r) = \frac{1}{B\left(\frac{1}{2}, \frac{n}{2}-1\right)}\left(1-r^2\right)^{n/2-2},\ -1 \le r \le 1.$

（在这里，像往常一样，和是抽样平均值和和是无偏方差估计量的平方根。）是β函数，为此 $\bar x$ $\bar y$ $S_x$ $S_y$ $B$

\begin{matrix} (1) & \frac{1}{B (\frac{1}{2}, \frac{n}{2} - 1)} = \frac{Γ (\frac{n - 1}{2})}{Γ (\frac{1}{2}) Γ (\frac{n}{2} - 1)} = \frac{Γ (\frac{n - 1}{2})}{\sqrt{π} Γ (\frac{n}{2} - 1)} . \end{matrix}

$\frac{1}{B\left(\frac{1}{2}, \frac{n}{2}-1\right)} = \frac{\Gamma\left(\frac{n-1}{2}\right)}{\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{n}{2}-1\right)} = \frac{\Gamma\left(\frac{n-1}{2}\right)}{\sqrt{\pi}\Gamma\left(\frac{n}{2}-1\right)} . \tag{1}$

为了计算，我们可以利用绕着生成的线绕旋转时的不变性，以及相同旋转下样本分布的不变性，并选择作为其分量总和为零的任何单位向量。 一个这样的向量与成比例。其标准偏差为 $r$ $\mathbb{R}^n$ $(1,1,\ldots, 1)$ $y_i/S_y$ $v = (n-1, -1, \ldots, -1)$

S_{v} = \sqrt{\frac{1}{n - 1} ((n - 1)^{2} + (- 1)^{2} + \dots + (- 1)^{2})} = \sqrt{n} .

$S_v = \sqrt{\frac{1}{n-1}\left((n-1)^2 + (-1)^2 + \cdots + (-1)^2\right)} = \sqrt{n}.$

因此，必须具有与以下相同的分布 $r$

\frac{\sum_{i = 1}^{n} (x_{i} - \bar{x}) (v_{i} - \bar{v})}{(n - 1) S_{x} S_{v}} = \frac{(n - 1) x_{1} - x_{2} - \dots - x_{n}}{(n - 1) S_{x} \sqrt{n}} = \frac{n (x_{1} - \bar{x})}{(n - 1) S_{x} \sqrt{n}} = \frac{\sqrt{n}}{n - 1} Z .

$\frac{\sum_{i=1}^n(x_i - \bar x)(v_i - \bar v)}{(n-1) S_x S_v} = \frac{(n-1)x_1 - x_2-\cdots-x_n}{(n-1) S_x \sqrt{n}} = \frac{n(x_1 - \bar x)}{(n-1) S_x \sqrt{n}} = \frac{\sqrt{n}}{n-1}Z.$

因此，我们需要做的是重新缩放以找到的分布： $r$ $Z$

f_{Z} (z) = | \frac{\sqrt{n}}{n - 1} | f (\frac{\sqrt{n}}{n - 1} z) = \frac{1}{B (\frac{1}{2}, \frac{n}{2} - 1)} \frac{\sqrt{n}}{n - 1} {(1 - \frac{n}{(n - 1)^{2}} z^{2})}^{n / 2 - 2}

$f_Z(z) = \big|\frac{\sqrt{n}}{n-1}\big| f\left(\frac{\sqrt{n}}{n-1}z\right) = \frac{1}{B\left(\frac{1}{2}, \frac{n}{2}-1\right)} \frac{\sqrt{n}}{n-1}\left(1- \frac{n}{(n-1)^2}z^2\right)^{n/2-2}$

对于。公式（1）表明这与问题相同。 $|z| \le \frac{n-1}{\sqrt{n}}$

不完全相信吗？这是对该情况进行100,000次模拟的结果（其中，其中分布均匀）。 $n=4$

第一直方图的相关系数，而第二直方图的相关系数对随机选择的向量对于所有迭代均保持固定。 他们都是统一的。右侧的QQ图确认这些分布基本相同。 $(x_i,y_i),i=1,\ldots,4$ $(x_i,v_i),i=1,\ldots,4)$ $v_i$

这R是生成绘图的代码。

n <- 4
n.sim <- 1e5
set.seed(17)
par(mfrow=c(1,3))
#
# Simulate spherical bivariate normal samples of size n each.
#
x <- matrix(rnorm(n.sim*n), n)
y <- matrix(rnorm(n.sim*n), n)
#
# Look at the distribution of the correlation of `x` and `y`.
#
sim <- sapply(1:n.sim, function(i) cor(x[,i], y[,i]))
hist(sim)
#
# Specify *any* fixed vector in place of `y`.
#
v <- c(n-1, rep(-1, n-1)) # The case in question
v <- rnorm(n)             # Can use anything you want
#
# Look at the distribution of the correlation of `x` with `v`.
#
sim2 <- sapply(1:n.sim, function(i) cor(x[,i], v))
hist(sim2)
#
# Compare the two distributions.
#
qqplot(sim, sim2, main="QQ Plot")

参考

RA Fisher，无限大样本中相关系数值的频率分布。 Biometrika，10，507参见第3节（引自统计肯德尔的先进理论，第5版，部分16.24）。

— ub
source

引用的链接已损坏。

— Sextus Empiricus

@Martijn谢谢您的检查。我明白您的意思了-链接有效，但没有任何意义！我已经解决了。

— 豪伯

4

我想建议通过贝叶斯定理直接计算的MVUE来获得Z的pdf的方法，尽管它既少又复杂。 $P(X\leq c)$

由于和，所以是联合完全足够的统计量，因此是这样的： $E[I_{(-\infty,c)}(X_1)]=P(X_1\leq c)$ $Z_1=\bar X$ $Z_2=S^2$ $P(X\leq c)$

ψ (z_{1}, z_{2}) = E [I_{(- \infty, c)} (X_{1}) | z_{1}, z_{2}] = \int_{- \infty}^{\infty} I_{(- \infty, c)} f_{X | Z_{1}, Z_{2}} (x_{1} | z_{1}, z_{2}) d x_{1}

$\psi(z_1,z_2)=E[I_{(-\infty,c)}(X_1)|z_1,z_2]=\int_{-\infty}^{\infty}I_{(-\infty,c)}f_{X|Z_1,Z_2}(x_1|z_1,z_2)dx_1$

现在使用贝叶斯定理，我们得到

f_{X | Z_{1}, Z_{2}} (x_{1} | z_{1}, z_{2}) = \frac{f_{Z_{1}, Z_{2} | X_{1}} (z_{1}, z_{2} | x_{1}) f_{X_{1}} (x_{1})}{f_{Z_{1}, Z_{2}} (z_{1}, z_{2})}

$f_{X|Z_1,Z_2}(x_1|z_1,z_2)={{f_{Z_1,Z_2|X_1}(z_1,z_2|x_1)f_{X_1}(x_1)}\over{f_{Z_1,Z_2}(z_1,z_2)}}$

分母可以用封闭形式编写，因为，彼此独立。 $f_{Z_1,Z_2}(z_1,z_2)=f_{Z_1}(z_1)f_{Z_2}(z_2)$ $Z_1 \sim N(\mu,\frac{\sigma^2}{n})$ $Z_2 \sim \Gamma({n-1\over 2},{2 \sigma^2\over n-1})$

要获得分子的封闭形式，我们可以采用以下统计信息：

W_{1} = \frac{\sum_{i = 2}^{n} X_{i}}{n - 1}

$W_1 = {\sum_{i=2}^n X_i \over n-1}$

W_{2} = \frac{\sum_{i = 2}^{n} X_{i}^{2} - (n - 1) W_{1}^{2}}{(n - 1) - 1}

$W_2 = {\sum_{i=2}^n X_i^2 -(n-1) W_1^2 \over (n-1)-1}$

这是的均值和样本方差，它们彼此独立，也独立于。我们可以用来表达这些。 $X_2, X_3, ..., X_n$ $X_1$ $Z_1, Z_2$

$W_1={n Z_1 - X_1\over n-1}$ ， $W_2={(n-1)Z_2+nZ_1^2-X_1^2-(n-1)W_1^2 \over n-2}$

我们可以在， $X_1=x_1$

f_{Z_{1}, Z_{2} | X_{1}} (z_{1}, z_{2} | x_{1}) = \frac{n}{n - 2} f_{W_{1}, W_{2}} (w_{1}, w_{2}) = \frac{n}{n - 2} f_{W_{1}} (w_{1}) f_{W_{2}} (w_{2})

$f_{Z_1,Z_2|X_1}(z_1,z_2|x_1)={n \over n-2}f_{W_1,W_2}(w_1,w_2)={n \over n-2}f_{W_1}(w_1)f_{W_2}(w_2)$

由于，我们可以得到它的封闭形式。请注意，这仅适用于，它将限制为。 $W_1 \sim N(\mu,\frac{\sigma^2}{n-1})$ $W_2 \sim \Gamma({n-2\over 2},{2 \sigma^2\over n-2})$ $w_2 \geq 0$ $x_1$ $z_1-{n-1 \over \sqrt n}\sqrt{z_2} \leq x_1 \leq z_1+{n-1 \over \sqrt n}\sqrt{z_2}$

因此，将它们放在一起，指数项将消失，而您会得到，

f_{X | Z_{1}, Z_{2}} (x_{1} | z_{1}, z_{2}) = \frac{Γ (\frac{n - 1}{2})}{\sqrt{π} Γ (\frac{n - 2}{2})} \frac{\sqrt{n}}{\sqrt{z_{2}} (n - 1)} (1 - {(\frac{\sqrt{n} (x_{1} - z_{1})}{\sqrt{z_{2}} (n - 1)})}^{2})

$f_{X|Z_1,Z_2}(x_1|z_1,z_2)={\Gamma({n-1 \over 2}) \over \sqrt{\pi} \Gamma({n-2 \over 2})} {\sqrt{n} \over \sqrt{z_2} (n-1)} (1-{({\sqrt{n} (x_1 -z_1) \over \sqrt{z_2} (n-1) })}^2)$ ，其中和其他位置为零。

z_{1} - \frac{n - 1}{\sqrt{n}} \sqrt{z_{2}} \leq x_{1} \leq z_{1} + \frac{n - 1}{\sqrt{n}} \sqrt{z_{2}}

$z_1-{n-1 \over \sqrt n}\sqrt{z_2} \leq x_1 \leq z_1+{n-1 \over \sqrt n}\sqrt{z_2}$

由此，我们可以使用变换获得的pdf 。 $Z={X_1- z_1 \over \sqrt{z_2}}$

顺便说一下，MVUE像这样：而，如果将为1

ψ (z_{1}, z_{2}) = \frac{Γ (\frac{n - 1}{2})}{\sqrt{π} Γ (\frac{n - 2}{2})} \int_{- \frac{π}{2}}^{θ_{c}} c o s^{n - 3} θ d θ

$\psi(z_1,z_2)={\Gamma({n-1 \over 2}) \over \sqrt{\pi} \Gamma({n-2 \over 2})} \int ^{\theta_c} _{-{\pi \over2}} cos^{n-3} \theta d\theta$

θ_{c} = s i n^{- 1} (\frac{\sqrt{n} (c - z_{1})}{(n - 1) \sqrt{z_{1}}})

$\theta_c = sin^{-1} ({\sqrt{n}(c-z_1)\over(n-1)\sqrt{z_1}})$

c \geq z_{1} + \frac{n - 1}{\sqrt{n} \sqrt{z_{2}}}

$c \geq z_1+{n-1 \over \sqrt{n} \sqrt{z_2} }$

我不是英语母语人士，可能会有一些尴尬的句子。我正在用霍格的数学统计入门教材独自学习统计。因此，可能存在一些语法或数学上的概念性错误。如果有人纠正它们，将不胜感激。

感谢您的阅读。

— 危险品
source