在对这个问题的最高答复中提出了这一主张。我认为“为什么”问题有足够的区别,因此有必要提出新的建议。谷歌搜索“详尽的关联度”并没有带来任何成功,我不确定该词组的含义。
在对这个问题的最高答复中提出了这一主张。我认为“为什么”问题有足够的区别,因此有必要提出新的建议。谷歌搜索“详尽的关联度”并没有带来任何成功,我不确定该词组的含义。
Answers:
最好理解多变量分布中的“关联度量”,使其包含所有属性,这些属性在任意重新缩放和重新设置值时保持不变。这样做可以将均值和方差更改为任何理论上允许的值(方差必须为正;均值可以是任何值)。
然后,相关系数(“皮尔森 ”)完全确定多元正态分布。一种查看方式是查看任何公式定义,例如密度函数或特征函数的公式。它们仅涉及均值,方差和协方差-但是当您知道方差时,可以互相推导协方差和相关性。
多元正态族不是拥有此属性的唯一分布族。例如,任何多元t分布(自由度超过)都具有定义明确的相关矩阵,并且也完全由其前两个矩确定。
变量可以通过Pearson相关完全不可见的方式进行关联。
这是关联但不关联的变量的另一个示例:
(即使我在这里用数据说明了分布,也正对分布进行了说明。)
即使变量之间具有相关性,Pearson相关性通常也不会告诉您如何 -您可以得到具有相同Pearson相关性的非常不同的关联形式(但是当变量为多变量正态时,我告诉您您可以确切地说出标准化变量之间的相关性)。
(解决多变量关联的常见方法是通过copula。网站上有许多与copula相关的问题;您可能会发现其中一些有用的问题)