具有秩相关的典范相关分析


15

典型相关分析(CCA)旨在最大化两个数据集的线性组合的通常Pearson乘积矩相关(即线性相关系数)。

现在,考虑该相关系数仅测量线性关联这一事实-这就是为什么我们也使用Spearman- 或Kendall- τ(秩)相关系数来测量之间的任意单调(不一定是线性)联系的原因。变量。ρτ

因此,我想到了以下几点:CCA的一个局限性在于,由于其目标函数,它仅试图捕获所形成的线性组合之间的线性关联。通过最大化Spearman- 而不是Pearson- r在某种意义上扩展CCA是否可行?ρr

这样的程序会导致任何统计学上可解释和有意义的事情吗?(例如,对等级执行CCA有意义吗??)我想知道当我们处理非常规数据时是否有帮助...


4
OVERALS -线性正则分析其最佳尺度(单调变换)变量最大化标准相关-可以根据自己的喜好?
ttnphns

@ttnphns:感谢您的想法,我之前从未听说过,看起来真的很有趣!但是,我认为它不能解决问题:据我了解,它本质上是最佳缩放和CCA的组合-但是最佳缩放仅对分类变量有意义。对于按比例尺测量的连续变量,它似乎并没有太大变化(我脑海中就想到了!)。但是,如果我错了,请纠正我。
塔玛斯·费伦奇

1
@ttnphns:嗯,有时候您在连续变量上使用Spearman相关性也是如此!(当然,它按顺序处理数据……但是我们绝对不会在绝对连续的变量上使用它来表征变量之间的一般单调(不仅是线性)关联。)这就是为什么我认为 CCA中也有意义...
塔玛斯·费伦奇

@Glen_b,你是对的。当然,排名相关性适用于任何单调性-是有序数据还是连续数据。我对上面的评论感到非常惊讶,因此将其删除。
ttnphns

您可以尝试使用Kernel CCA,它特别是与径向基函数一起使用时,可以使我们将数据投影到无限维子空间中。
roni

Answers:


6

在计算规范变量时,我使用了受限的三次样条展开。您将向非线性分析中添加非线性基函数的方式与添加新功能完全相同。这导致非线性主成分分析。有关示例,请参见R Hmisctranscan功能。R homals软件包使这一点更加深入。


1
谢谢!霍马斯书中描述的方法对我来说是新颖的,但绝对很有趣。
塔玛斯·费伦奇

4

CCA的标准方法适用于乘积力矩相关系数矩阵。对于最大幅度CC,它通过两个矩阵(具有n行以及m1和m2变量)的线性组合构造两个复合变量z1(n)和z2(n),从而使abs(correlation(z1,z2))最大化。即使correlation(z1,z2)不是乘积矩而是定义不同,也可以直接使该目标函数最大化。

Mishra,SK(2009)“关于两组排名得分的序数典型相关分析的注记”

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.