Questions tagged «covariance»

协方差是一个量度,用于测量两个变量之间的线性关系的强度和方向。协方差是无标度的,因此通常很难解释;当按变量的SD进行缩放时,它将成为Pearson的相关系数。

10
您将如何向仅理解均值的人解释协方差?
……假设我能够以一种直观的方式(直观地理解“方差”)或说:他们是数据值与“均值”的平均距离,并且方差是平方单位,我们取平方根以保持单位不变,这称为标准偏差。 让我们假设这是“接收者”明确表达和(希望)理解的。现在什么是协方差?如何在不使用任何数学术语/公式的情况下用简单的英语解释它?(即,直观的解释。;) 请注意:我确实知道该概念背后的公式和数学公式。我希望能够以一种易于理解的方式“解释”相同的内容,而无需包括数学运算。即“协方差”到底是什么意思?


6
您如何解释相关性和协方差之间的区别?
跟进这个问题,您将如何向仅理解均值的人解释协方差?谈到向外行人解释协方差的问题,我想到了一个类似的问题。 如何向统计学新手解释协方差和相关性之间的区别?似乎两者均指代链接到另一个变量的一个变量的更改。 与提到的问题类似,缺少公式将是可取的。



4
协方差和独立性?
我从课本中得知不能保证X和Y是独立的。但是,如果它们是独立的,则它们的协方差必须为0。有人可以提供吗?COV (X,Y)= 0冠状病毒(X,ÿ)=0\text{cov}(X,Y)=0


2
协方差矩阵的逆对数据说什么?(直觉上)
我对的性质感到好奇。任何人都可以说出一些直觉的信息“对数据有何看法?”Σ−1Σ−1\Sigma^{-1}Σ−1Σ−1\Sigma^{-1} 编辑: 感谢您的回复 在学习了一些很棒的课程之后,我想补充一点: 它是信息的度量,即是沿方向的信息量。xTΣ−1xxTΣ−1xx^T\Sigma^{-1}xxxx 对偶性:由于是正定的,也是正定的,因此它们是点积范数,更确切地说,它们是彼此的偶范数,因此我们可以针对正则化最小二乘问题导出Fenchel对偶,并最大化wrt对偶问题。我们可以根据它们的条件选择它们之一。ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1} 希尔伯特空间:和列(和行)跨越相同的空间。因此,使用或表示之间没有任何优势(当这些矩阵之一处于不适状态时)Σ−1Σ−1\Sigma^{-1}ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1}ΣΣ\Sigma 贝叶斯统计:范数在贝叶斯统计中起重要作用。也就是说,它确定了我们之前有多少信息,例如,当先验密度的协方差像 我们将获得非信息性信息(或者可能是Jeffreys先前的信息)Σ−1Σ−1\Sigma^{-1}∥Σ−1∥→0‖Σ−1‖→0\|\Sigma^{-1}\|\rightarrow 0 惯常统计:使用Cramér-Rao界线,它与Fisher信息密切相关。实际上,费舍尔信息矩阵(对数似然梯度自身的外积)是Cramér–Rao约束的,即Σ−1⪯FΣ−1⪯F\Sigma^{-1}\preceq \mathcal{F}(正半定锥,即浓度)椭圆形)。因此,当Σ−1=FΣ−1=F\Sigma^{-1}=\mathcal{F},最大似然估计器是有效的,即,数据中存在最大信息,因此频频机制是最佳的。用简单的话来说,对于某些似然函数(请注意,似然函数的形式完全取决于可能生成数据的概率模型,即生成模型),最大似然是有效且一致的估计器,其规则类似于老板。(对不起,杀了它)

6
为什么协方差估计量的分母不应该是n-2而不是n-1?
(无偏)方差估计量的分母为因为有观测值,并且仅估计了一个参数。n−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} 同样,我想知道为什么在估计两个参数时协方差的分母为何不为?n−2n−2n-2 Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}



4
使用最大似然拟合多元正态模型时,如何确保协方差矩阵的性质?
假设我有以下模型 yi=f(xi,θ)+εiyi=f(xi,θ)+εiy_i=f(x_i,\theta)+\varepsilon_i 其中, 是解释变量的向量,\ theta是非线性函数f和\ varepsilon_i \ sim N(0,\ Sigma)的参数,其中\ Sigma自然是K \ times K矩阵。yi∈RKyi∈RKy_i\in \mathbb{R}^Kxixix_iθθ\thetafffε一世〜ñ(0 ,Σ )εi∼N(0,Σ)\varepsilon_i\sim N(0,\Sigma)ΣΣ\Sigmaķ× KK×KK\times K 通常的目标是估算θθ\theta和ΣΣ\Sigma。明显的选择是最大似然法。此模型的对数似然性(假设我们有一个样本(y一世,X一世),我= 1 ,。。。,n(yi,xi),i=1,...,n(y_i,x_i),i=1,...,n)看起来像 l (θ ,Σ )= − n2日志(2 π)− n2日志DET Σ - Σ我= 1ñ(y一世- ˚F(x一世,θ ))′Σ− 1(y- ˚F(x一世,θ)))l(θ,Σ)=−n2log⁡(2π)−n2log⁡detΣ−∑i=1n(yi−f(xi,θ))′Σ−1(y−f(xi,θ)))l(\theta,\Sigma)=-\frac{n}{2}\log(2\pi)-\frac{n}{2} \log\det\Sigma-\sum_{i=1}^n(y_i-f(x_i,\theta))'\Sigma^{-1}(y-f(x_i,\theta))) 现在,这似乎很简单,指定了对数似然性,将其放入数据中,并使用某种算法进行非线性优化。问题是如何确保ΣΣ\Sigma为正定。例如,optim在R中使用R(或任何其他非线性优化算法)将无法保证ΣΣ\Sigma是正定的。 那么问题是如何确保ΣΣ\Sigma保持正定值?我看到两种可能的解决方案: 重新参数化ΣΣ\Sigma为 RR′RR′RR',其中RRR是上三角或对称矩阵。然后ΣΣ\Sigma将始终是正定的,并且RRR可以不受约束。 使用配置文件可能性。推导θ^(Σ)θ^(Σ)\hat\theta(\Sigma)和\ hat {\ Sigma}(\ theta)的公式Σ^(θ)Σ^(θ)\hat{\Sigma}(\theta)。从一些\ theta_0开始θ0θ0\theta_0并迭代Σ^Ĵ= …

3
非正定协方差矩阵对我的数据有什么影响?
我有许多多变量观测值,并希望评估所有变量的概率密度。假定数据是正态分布的。在低数量的变量下,一切都会按我预期的那样工作,但移至更大的数量会导致协方差矩阵变为非正定。 我已将Matlab中的问题减少为: load raw_data.mat; % matrix number-of-values x number of variables Sigma = cov(data); [R,err] = cholcov(Sigma, 0); % Test for pos-def done in mvnpdf. 如果err> 0,则Sigma不是正定的。 为了评估更高维度的实验数据,我可以做些什么?它可以告诉我有关数据的任何有用信息吗? 我在这方面是个初学者,所以如果我错过了一些明显的事情,我深表歉意。

2
什么时候距离协方差不如线性协方差合适?
刚刚(模糊地)向我介绍了Brownian /距离协方差/相关性。在测试依赖性时,它在许多非线性情况下似乎特别有用。但是,尽管协方差/相关经常用于非线性/混沌数据,但它似乎并不经常使用。 这使我认为距离协方差可能存在一些缺点。那么它们是什么?为什么每个人都不总是使用距离协方差?

2
线性变换后随机向量的协方差
如果是随机向量并且是一个固定矩阵,有人可以解释为什么甲Ç ö v [ 甲ž ] = 甲Ç ö v [ Ž ] 甲⊤。ZZ\mathbf {Z}AAAcov[AZ]=Acov[Z]A⊤.cov[AZ]=Acov[Z]A⊤.\mathrm{cov}[A \mathbf {Z}]= A \mathrm{cov}[\mathbf {Z}]A^\top.
20 covariance 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.