Questions tagged «covariance-matrix»

甲的所有对之间的协方差矩阵随机变量。它也称为方差-协方差矩阵或简称为协方差矩阵。 k×kķ

3
lmer中的方差-协方差矩阵
我知道混合模型的优点之一是它们允许为数据指定方差-协方差矩阵(化合物对称性,自回归,非结构化等)。但是,lmerR中的函数不允许对该矩阵进行简单说明。有谁知道lmer默认使用什么结构,为什么没有办法轻松指定它?

3
主成分分析“向后”:给定的变量线性组合可解释多少数据差异?
我对六个变量AAA,BBB,CCC,DDD,EEE和进行了主成分分析FFF。如果我理解正确,未旋转的PC1会告诉我这些变量的线性组合描述/解释了数据中的最大方差,而PC2告诉我这些变量的线性组合描述了数据中的第二大方差,依此类推。 我只是很好奇-有什么办法可以做到这一点吗?假设我选择了这些变量的线性组合-例如A+2B+5CA+2B+5CA+2B+5C,我能算出所描述数据的方差是多少?

1
稳健的PCA与稳健的Mahalanobis距离,可用于异常值检测
健壮的PCA(由Candes等人2009或Netrepalli等人2014年开发)是一种流行的多变量离群值检测方法,但考虑到协方差矩阵的鲁棒,规则化估计,马氏距离也可以用于离群值检测。我很好奇使用一种方法相对于另一种方法的(缺点)优势。 我的直觉告诉我,两者之间的最大区别是:当数据集为“小”(从统计意义上来说)时,稳健的PCA将给出较低等级的协方差,而稳健的协方差矩阵估计将给出完整的-由于Ledoit-Wolf正则化导致的秩协方差。这又如何影响离群值检测?


5
从协方差矩阵衡量“方差”?
如果数据为1d,则方差表示数据点彼此不同的程度。如果数据是多维的,我们将获得协方差矩阵。 对于多维数据,通常有没有一种方法可以给出单个的数据点彼此之间如何不同的数量? 我认为可能已经有很多解决方案,但是我不确定搜索所用的正确术语。 也许我可以做一些事情,例如将协方差矩阵的特征值相加,这听起来明智吗?



1
如何从曲线拟合中解释协方差矩阵?
我不太擅长统计,因此很抱歉,这是一个简单的问题。我以曲线拟合的一些数据,有时候我的数据最适合的形式负指数,有时配合是更接近于一个* é (- b * X 2) + c。但是,有时两者都失败了,我想回到线性拟合中。我的问题是,如何根据从模型返回的结果方差-协方差矩阵确定哪种模型最适合特定数据集一个* ê(- b * X )+ c一种∗Ë(-b∗X)+Ca * e^{(-b * x)} + c一个* ê(- b * X2)+ c一种∗Ë(-b∗X2)+Ca * e^{(-b * x^2)} + cscipy.optimize.curve_fit()函数?我相信方差在此矩阵的对角线之一上,但我不确定如何解释。 更新:基于类似的问题,我希望方差-协方差矩阵可以告诉我我正在尝试的三个模型中的哪个最适合数据(我正在尝试将许多数据集适合这三个模型之一)。 对于给定的示例,结果矩阵如下所示: pcov_lin [[ 2.02186921e-05 -2.02186920e-04] [ -2.02186920e-04 2.76322124e-03]] pcov_exp [[ 9.05390292e+00 -7.76201283e-02 -9.20475334e+00] [ -7.76201283e-02 6.69727245e-04 7.90218415e-02] …

1
Gelman和Rubin收敛性诊断,如何泛化以使用向量?
Gelman和Rubin诊断程序用于检查并行运行的多个mcmc链的收敛性。它将链内方差与链间方差进行比较,说明如下: 步骤(针对每个参数): 从过度分散的起始值运行m≥2个长度为2n的链。 丢弃每个链中的前n个平局。 计算链内和链间方差。 将参数的估计方差计算为链内方差和链间方差的加权和。 计算潜在的水垢减少因子。 项目清单 我想使用此统计信息,但我想使用的变量是随机向量。 在这种情况下,取协方差矩阵的均值是否有意义?

1
双胞胎研究数据的线性混合效应建模
假设我有一些响应变量,该变量是从第个家庭中的第个兄弟姐妹测得的。另外,从每个受试者同时收集了一些行为数据。我正在尝试使用以下线性混合效应模型来分析情况: j i x i jyijyijy_{ij}jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + \alpha_1 x_{ij} + \delta_{1i} x_{ij} + \varepsilon_{ij} 其中和分别是固定截距和斜率, 是随机斜率,而是残差。α 1 δ 1 我 ε 我Ĵα0α0\alpha_0α1α1\alpha_1δ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} 随机效应和残余的假设是(假设每个家庭中只有两个同胞) ε 我Ĵδ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} δ1 我(ε我1,ε我2)Ť〜dñ(0 ,τ2)〜dñ((0 ,0 )Ť,R )δ1i∼dN(0,τ2)(εi1,εi2)T∼dN((0,0)T,R)\begin{align} \delta_{1i} &\stackrel{d}{\sim} N(0, \tau^2) \\[5pt] (\varepsilon_{i1}, \varepsilon_{i2})^T &\stackrel{d}{\sim} N((0, 0)^T, R) \end{align} 其中是未知方差参数,方差-协方差结构是2 x 2形式的对称矩阵 - …

1
高斯混合模型的不同协方差类型
在这里尝试使用高斯混合模型时,我发现了这4种协方差。 'full' (each component has its own general covariance matrix), 'tied' (all components share the same general covariance matrix), 'diag' (each component has its own diagonal covariance matrix), 'spherical' (each component has its own single variance). 我在Google上进行了大量搜索,以找到有关每种类型的更多详细信息,但仅找到了非常高级的描述(例如this)。 欣赏有人可以帮助我理解这些内容,或者至少将我引导到可以阅读这些内容的地方。


2
贝叶斯优化的GP回归中的病态条件协方差矩阵
背景与问题 我正在使用高斯过程(GP)进行回归和随后的贝叶斯优化(BO)。为了进行回归,我使用了针对MATLAB 的gpml包,并进行了一些自定义修改,但是问题很普遍。 众所周知的事实是,当两个训练输入在输入空间中太近时,协方差矩阵可能变为非正定的(此站点上有几个问题)。结果,由于数值误差,各种GP计算所需的协方差矩阵的Cholesky分解可能会失败。在使用我使用的目标函数执行BO时,在某些情况下这发生在我身上,我想对其进行修复。 拟议的解决方案 AFAIK,减轻不适的标准解决方案是在协方差矩阵的对角线上添加一个脊或块。对于GP回归,这等于增加(或增加,如果已经存在)观察噪声。 到现在为止还挺好。我修改了gpml的精确推论代码,以便每当Cholesky分解失败时,我都会尝试将协方差矩阵固定为Frobenius范数中最接近的对称正定(SPD)矩阵,这是受约翰d'Errico的MATLAB代码启发的。这样做的理由是要尽量减少对原始矩阵的干预。 这个变通办法可以完成工作,但是我注意到对于某些功能,BO的性能大大降低了-可能是每当算法需要放大某些区域时(例如,因为算法越来越接近最小值,或者因为长度缩放)问题变得越来越小)。这种行为是有道理的,因为每当两个输入点距离太近时,我都会有效地增加噪声,但这当然不是理想的选择。或者,我可以删除有问题的点,但是,有时候,我需要输入点很接近。 题 我认为GP协方差矩阵的Cholesky因式分解的数值问题不是一个新问题,但令我惊讶的是,除了增加噪声或消除彼此之间太近的点外,到目前为止,我找不到许多解决方案。另一方面,我的某些功能确实表现得很差,所以也许我的情况不是那么典型。 有什么建议/参考可以在这里有用吗?

2
方差-协方差矩阵解释
假设我们有一个线性模型,Model1并vcov(Model1)给出以下矩阵: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 对于此示例,此矩阵实际显示什么?我们可以为模型及其独立变量安全地做出哪些假设?

2
两个协方差矩阵的和和乘积也是协方差矩阵吗?
假设我有协方差矩阵和。那么,这些选项中的哪一个也是协方差矩阵?ÿXXXYYY X+YX+YX+Y X2X2X^2 XYXYXY 我很难理解要成为协方差矩阵的确切条件。我想这意味着,例如,如果和,则对于1成立,我们应该具有该,其中和是其他一些随机变量。但是,我不明白为什么这对于三个选项都适用。任何见解将不胜感激。Y = cov (Y 1,Y 2)cov (X 1,X 2)+ cov (Y 1,Y 2)= cov (Z 1,Z 2)Z 1 Z 2X=cov(X1,X2)X=cov⁡(X1,X2)X=\operatorname{cov}(X_1,X_2)Y=cov(Y1,Y2)Y=cov⁡(Y1,Y2)Y=\operatorname{cov}(Y_1,Y_2)cov(X1,X2)+cov(Y1,Y2)=cov(Z1,Z2)cov⁡(X1,X2)+cov⁡(Y1,Y2)=cov⁡(Z1,Z2)\operatorname{cov}(X_1,X_2) + \operatorname{cov}(Y_1,Y_2) = \operatorname{cov}(Z_1, Z_2)Z1Z1Z_1Z2Z2Z_2

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.