Questions tagged «covariance-matrix»

甲的所有对之间的协方差矩阵随机变量。它也称为方差-协方差矩阵或简称为协方差矩阵。 k×kķ

6
是否有对数据矩阵
对于给定的数据矩阵AAA(列中有变量,行中有数据点),似乎ATAATAA^TA在统计中起着重要作用。例如,它是普通最小二乘分析解决方案的重要组成部分。或者,对于PCA,其特征向量是数据的主要成分。 我知道如何计算ATAATAA^TA,但是我想知道是否可以直观地解释此矩阵表示什么,从而导致它的重要作用?

3
示例:使用glmnet获得二进制结果的LASSO回归
我开始与使用的涉猎glmnet与LASSO回归那里我感兴趣的结果是二分。我在下面创建了一个小的模拟数据框: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

5
如何解释逆协方差或精度矩阵?
我想知道是否有人可以指出一些参考文献,这些参考文献讨论逆协方差矩阵(也称为浓度矩阵或精度矩阵)的元素的解释。 我可以访问Cox和Wermuth的Multivariate Dependencies,但是我正在寻找的是对逆矩阵中每个元素的解释。维基百科指出:“精度矩阵的元素具有偏相关和偏方差的解释”,这使我进入了此页面。有没有使用线性回归的解释吗?IE,是协方差还是几何?





4
两个协方差矩阵之间的相似性或距离的度量
两个对称协方差矩阵(都具有相同的维数)之间是否有相似度或距离的度量? 我在这里考虑的是两个概率分布的KL散度的类比或矢量之间的欧几里得距离,除了适用于矩阵。我想会有很多相似性度量。 理想情况下,我还要检验两个协方差矩阵相同的零假设。

5
如何生成存在一些强相关性的大型满秩随机相关性矩阵?
我想生成一个n × n大小的随机相关矩阵CC\mathbf C,以便存在一些中等强度的相关:n×nn×nn \times n n×nn×nn \times n大小的平方实对称矩阵,例如n=100n=100n=100; 正定的,即所有特征值都是实数和正数; 全职 所有对角线元素等于111 ; 非对角元素应均匀地合理地分布在(−1,1)(−1,1)(-1, 1)。确切的分布无关紧要,但是我希望有一些适度较大的值(例如10%10%10\%)的适度较大的值(例如,绝对值为0.50.50.5或更高)。基本上我想确保CC\mathbf C是不是所有的非对角线元素几乎对角线≈0≈0\approx 0。 有简单的方法吗? 目的是使用此类随机矩阵来对一些使用相关(或协方差)矩阵的算法进行基准测试。 无效的方法 以下是一些我知道的生成随机相关矩阵的方法,但不适用于我: 生成随机XX\mathbf X的s×ns×ns \times n大小,中心,规范并形成相关矩阵C=1s−1X⊤XC=1s−1X⊤X\mathbf C=\frac{1}{s-1}\mathbf X^\top \mathbf X。如果s>ns>ns>n,通常将导致所有非对角相关性都在附近000。如果s≪ns≪ns\ll n,存在一定相关性会很强,但CC\mathbf C不会是满秩。 以下列方式之一生成随机正定矩阵BB\mathbf B: 生成随机正方形AA\mathbf A,使对称正定B=AA⊤B=AA⊤\mathbf B = \mathbf A \mathbf A^\top。 生成随机正方形AA\mathbf A,使对称E=A+A⊤E=A+A⊤\mathbf E = \mathbf A + \mathbf A^\top,并使其正定通过执行特征分解E=USU⊤E=USU⊤\mathbf …

1
有没有一种方法可以使用协方差矩阵来找到用于多元回归的系数?
对于简单的线性回归,可以直接从方差-协方差矩阵CCC, C d ,e计算回归系数。Cd,eCe,eCd,eCe,e C_{d, e}\over C_{e,e} 其中ddd是因变量的指数,和eee是解释变量的指数。 如果只有协方差矩阵,是否可以为具有多个解释变量的模型计算系数? ETA:对于双解释变量,看来 和类似地用于β2。我没有立即看到如何将其扩展到三个或更多变量。β1=Cov(y,x1)var(x2)−Cov(y,x2)Cov(x1,x2)var(x1)var(x2)−Cov(x1,x2)2β1=Cov(y,x1)var(x2)−Cov(y,x2)Cov(x1,x2)var(x1)var(x2)−Cov(x1,x2)2\beta_1 = \frac{Cov(y,x_1)var(x_2) - Cov(y,x_2)Cov(x_1,x_2)}{var(x_1)var(x_2) - Cov(x_1,x_2)^2} β2β2\beta_2

2
使用给定的样本协方差矩阵生成数据
给定协方差矩阵,如何生成数据,使其具有样本协方差矩阵\ hat {\ boldsymbol \ Sigma} = \ boldsymbol \ Sigma_s?ΣsΣs\boldsymbol \Sigma_sΣ^=ΣsΣ^=Σs\hat{\boldsymbol \Sigma} = \boldsymbol \Sigma_s 更笼统地说:我们经常对从密度f(x \ vert \ boldsymbol \ theta)生成数据感兴趣f(x|θ)f(x|θ) f(x \vert \boldsymbol\theta) ,其中数据xxx给出了一些参数矢量θθ\boldsymbol\theta。这产生了一个样本,然后我们可以据此再次估计值θ^θ^\boldsymbol{\hat\theta}。我感兴趣的是一个反向问题:如果给我们一组参数θsθs\boldsymbol\theta_{s},并且我们想生成一个样本xxx例如\ boldsymbol {\ hat \ theta} = \ boldsymbol,该怎么办?\ theta_ {s}θ^=θsθ^=θs \boldsymbol{\hat\theta} = \boldsymbol\theta_{s}。 这是一个已知问题吗?这样的方法有用吗?有可用的算法吗?

3
多重删失数据的协方差矩阵的无偏估计
环境样品的化学分析通常低于报告限值或各种检测/定量限值。后者通常可以与其他变量的值成比例地变化。例如,可能需要稀释一种化合物的高浓度样品进行分析,从而导致该样品中同时分析的所有其他化合物的检测限按比例膨胀。再举一个例子,有时化合物的存在会改变测试对其他化合物的响应(“基质干扰”)。当实验室检测到这种情况时,它将相应地提高其报告限值。 我正在寻找一种实用的方法来估算此类数据集的整个方差-协方差矩阵,尤其是当许多化合物经历了超过50%的检查时,这种情况经常发生。传统的分布模型是(真实)浓度的对数呈多态正态分布,这在实践中似乎很合适,因此针对这种情况的解决方案将很有用。 (“实用”是指一种方法,该方法可以在至少一个普遍可用的软件环境(例如R,Python,SAS等)中可靠地进行编码,并且其执行速度足以支持迭代的重新计算(例如多次插补),且这种情况相当稳定[这就是为什么我不愿探索BUGS实现的原因,尽管通常欢迎使用贝叶斯解决方案]。 预先非常感谢您对此事的想法。

4
如何创建任意协方差矩阵
例如,在R中的MASS::mvrnorm()功能对于生成数据以演示统计中的各种情况很有用。它采用强制性Sigma参数,该参数是一个对称矩阵,用于指定变量的协方差矩阵。如何创建带有任意条目的对称矩阵?n × nñ×ñn\times n

7
为什么对称正定(SPD)矩阵如此重要?
我知道对称正定(SPD)矩阵的定义,但想了解更多。 从直觉上为什么它们如此重要? 这就是我所知道的。还有什么? 对于给定的数据,协方差矩阵为SPD。协方差矩阵是一项重要的指标,有关直观说明,请参见这篇出色的文章。 如果是SPD ,则二次形式是凸的。凸性对于可以确保本地解决方案是全局解决方案的函数是很好的属性。对于凸问题,有很多好的算法可以解决,但对于非凸问题则没有。甲12x⊤Ax−b⊤x+c12x⊤Ax−b⊤x+c\frac 1 2 x^\top Ax-b^\top x +cAAA 当为SPD时,二次形式的优化解与线性系统的解相同。因此,我们可以在两个经典问题之间进行转换。这很重要,因为它使我们能够使用在另一个域中发现的技巧。例如,我们可以使用共轭梯度法求解线性系统。减少1AAA甲X=bminimize 12x⊤Ax−b⊤x+cminimize 12x⊤Ax−b⊤x+c\text{minimize}~~~ \frac 1 2 x^\top Ax-b^\top x +cAx=bAx=bAx=b 有许多很好的算法(快速,数值稳定)对SPD矩阵更有效,例如Cholesky分解。 编辑:我不是想问一下SPD矩阵的身份,而是属性背后的直觉来显示重要性。例如,正如@Matthew Drury所提到的,如果矩阵是SPD,则特征值都是正实数,但是为什么所有正数都重要。@Matthew Drury对流动有一个很好的答案,这就是我想要的。

4
在实践中,如何在混合效应模型中计算随机效应协方差矩阵?
基本上,我想知道的是如何实施不同的协方差结构,以及如何计算这些矩阵内的值。像lme()这样的函数允许我们选择所需的结构,但是我很想知道它们是如何估算的。 考虑线性混合效应模型。ÿ= Xβ+ Zu + ϵY=Xβ+Zu+ϵY=X\beta+Zu+\epsilon 其中和。此外:ε d 〜 Ñ (0 ,- [R )你〜dñ(0 ,D )u∼dN(0,D)u \stackrel{d}{\sim} N(0,D)ε 〜dñ(0 ,R )ϵ∼dN(0,R)\epsilon \stackrel{d}{\sim} N(0,R) V一个[R (ÿ| X,Z,β,u )= RVar(Y|X,Z,β,u)=RVar(Y|X,Z,\beta,u)=R V一个[R (ÿ| X,β)= Z′d ž+ R = VVar(Y|X,β)=Z′DZ+R=VVar(Y|X,\beta)=Z'DZ+R=V 为了简单起见,我们假设。R = σ2一世ñR=σ2InR=\sigma^2I_n 基本上我的问题是:对于各种参数设置,如何从数据中准确估算?假设我们假设是对角线的(随机效应是独立的)或完全参数化的(目前我比较感兴趣的情况)还是其他各种参数化中的任何一个?有没有简单的估计器/方程式?(毫无疑问,这是迭代估算的。)D DdDDdDDdDD 编辑: 从《方差组件》一书(Searle,Casella,McCulloch 2006),我设法做到以下几点: 如果则更新和计算方差成分,如下所示:D = σ2ü一世qD=σu2IqD=\sigma^2_uI_q σ2 (ķ + …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.