我们独立于正态分布绘制样本,每个样本的大小为。(μ ,σ 2)
然后,从样本中选择彼此具有最高(绝对)Pearson相关性的2个样本。
这种相关性的期望值是多少?
谢谢[PS这不是作业]
2
(+1)这将是一个颇具挑战性的作业问题:-)。您是否需要一个一般性的答案,或者(也许)可以将注意力集中在或特定值上?例如,当远大于时,有可能得出良好的近似值。在其他情况下,可能需要不同的近似值。n n N
—
whuber
我希望有一个一般性的答案,但是假设可以了!对于和特定值,它不会那么有趣,因为我可以通过仿真观察这种特定情况(这是我目前正在做的事情),但它可能仍然很有趣。Ñ Ñ
—
P Sellaz
我认为,对任何实际实用程序的通用解决方案都不太可能,尽管我可能会误会。它与几何和线性代数之间的一些开放问题密切相关。在应用中,例如在压缩感测中就需要关于这种量的信息。
—
主教
FWIW,这是我刚刚运行的模拟的结果:使用Normal(0,1),我发现均值相关(超过1000个模拟)和样本数量近似与相关使用线性回归模型, 对于和模型拟合和常规诊断都很好。我还发现,平均相关性大致呈正态分布(尽管稍微偏右)。Ñ ρ = 0.025 + 0.113 LN (Ñ )- 0.008 LN (Ñ )2 Ñ = 100 4 ≤ Ñ ≤ Ñ
—
P Sellaz