Questions tagged «matrix»

矩阵(复数矩阵)是排列成行和列的数字,符号或表达式的矩形阵列。矩阵中的各个项目称为其元素或条目。


9
为什么突然对张量着迷?
我最近注意到,很多人都在开发许多方法的张量等效项(张量分解,张量内核,用于主题建模的张量等),我想知道,为什么世界突然对张量着迷?最近是否有特别令人惊讶的论文/标准结果带来了这一结果?在计算上比以前怀疑的便宜很多吗? 我不是一个傻瓜,我很感兴趣,并且如果有关于这方面的文章的指针,我很想阅读。

6
是否有对数据矩阵
对于给定的数据矩阵AAA(列中有变量,行中有数据点),似乎ATAATAA^TA在统计中起着重要作用。例如,它是普通最小二乘分析解决方案的重要组成部分。或者,对于PCA,其特征向量是数据的主要成分。 我知道如何计算ATAATAA^TA,但是我想知道是否可以直观地解释此矩阵表示什么,从而导致它的重要作用?

8
生成与现有变量具有定义的相关性的随机变量
对于模拟研究,我必须生成随机变量,这些变量显示与现有变量的预定义(填充)相关性。ÿYY 我研究了这些R软件包copula,CDVine它们可以生成具有给定依赖关系结构的随机多变量分布。但是,不可能将结果变量之一固定为现有变量。 任何想法和现有功能的链接表示赞赏! 结论: 提出了两个有效的答案,有不同的解决方案: 一个R 脚本由卡拉卡尔,其计算与一个随机变量精确(样品)的相关性,以一个预定义的变量 我发现了一个R 函数,该函数计算与预定义变量具有定义的总体相关性的随机变量 [@ttnphns的补充:我可以自由地将问题标题从单个固定变量的情况扩展到任意数量的固定变量;即如何生成具有预定义正确性和一些固定的现有变量的变量]

1
什么相关使矩阵奇异?奇异或接近奇异意味着什么?
我在不同的矩阵上进行一些计算(主要是在逻辑回归中),并且通常会收到错误“矩阵是奇异的”,我必须返回并删除相关变量。我的问题是,您认为“高度”相关的矩阵是什么?有相关阈值来表示这个词吗?就像某个变量与另一个变量相关联是0.97一样,这是否足以使矩阵奇异? 如果问题很基本,我很抱歉,我找不到任何谈论此问题的参考文献(对任何参考文献的提示将是一个很大的加分!)。


3
SVD背后的直觉是什么?
我已经读过关于奇异值分解(SVD)的文章。在几乎所有的教科书中都提到将矩阵分解为具有给定规格的三个矩阵。 但是,以这种形式拆分矩阵背后的直觉是什么?PCA和其他用于降维的算法在算法具有良好的可视化特性的意义上是直观的,但使用SVD并非如此。


2
协方差矩阵的逆对数据说什么?(直觉上)
我对的性质感到好奇。任何人都可以说出一些直觉的信息“对数据有何看法?”Σ−1Σ−1\Sigma^{-1}Σ−1Σ−1\Sigma^{-1} 编辑: 感谢您的回复 在学习了一些很棒的课程之后,我想补充一点: 它是信息的度量,即是沿方向的信息量。xTΣ−1xxTΣ−1xx^T\Sigma^{-1}xxxx 对偶性:由于是正定的,也是正定的,因此它们是点积范数,更确切地说,它们是彼此的偶范数,因此我们可以针对正则化最小二乘问题导出Fenchel对偶,并最大化wrt对偶问题。我们可以根据它们的条件选择它们之一。ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1} 希尔伯特空间:和列(和行)跨越相同的空间。因此,使用或表示之间没有任何优势(当这些矩阵之一处于不适状态时)Σ−1Σ−1\Sigma^{-1}ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1}ΣΣ\Sigma 贝叶斯统计:范数在贝叶斯统计中起重要作用。也就是说,它确定了我们之前有多少信息,例如,当先验密度的协方差像 我们将获得非信息性信息(或者可能是Jeffreys先前的信息)Σ−1Σ−1\Sigma^{-1}∥Σ−1∥→0‖Σ−1‖→0\|\Sigma^{-1}\|\rightarrow 0 惯常统计:使用Cramér-Rao界线,它与Fisher信息密切相关。实际上,费舍尔信息矩阵(对数似然梯度自身的外积)是Cramér–Rao约束的,即Σ−1⪯FΣ−1⪯F\Sigma^{-1}\preceq \mathcal{F}(正半定锥,即浓度)椭圆形)。因此,当Σ−1=FΣ−1=F\Sigma^{-1}=\mathcal{F},最大似然估计器是有效的,即,数据中存在最大信息,因此频频机制是最佳的。用简单的话来说,对于某些似然函数(请注意,似然函数的形式完全取决于可能生成数据的概率模型,即生成模型),最大似然是有效且一致的估计器,其规则类似于老板。(对不起,杀了它)

3
如何取多元正态密度的导数?
假设我具有多元正态N(μ,Σ)N(μ,Σ)N(\mu, \Sigma)密度。我想获得第二(局部的)衍生物WRT μμ\mu。不知道如何取矩阵的导数。 维基说在矩阵中逐个元素地取导数。 我正在使用拉普拉斯逼近 logPN(θ)=logPN−12(θ−θ^)TΣ−1(θ−θ^).log⁡PN(θ)=log⁡PN−12(θ−θ^)TΣ−1(θ−θ^).\log{P}_{N}(\theta)=\log {P}_{N}-\frac{1}{2}{(\theta-\hat{\theta})}^{T}{\Sigma}^{-1}(\theta-\hat{\theta}) \>. 模式是 θ = μ。θ^=μθ^=μ\hat\theta=\mu 我得到Σ−1=−∂2∂θ2logp(θ^|y),Σ−1=−∂2∂θ2log⁡p(θ^|y),{\Sigma}^{-1}=-\frac{{{\partial }^{2}}}{\partial {{\theta }^{2}}}\log p(\hat{\theta }|y),这究竟是怎么来的呢? 我所做的: logP(θ|y)=−k2log2π−12log|Σ|−12(θ−θ^)TΣ−1(θ−θ^)log⁡P(θ|y)=−k2log⁡2π−12log⁡|Σ|−12(θ−θ^)TΣ−1(θ−θ^)\log P(\theta|y) = -\frac{k}{2} \log 2 \pi - \frac{1}{2} \log \left| \Sigma \right| - \frac{1}{2} {(\theta-\hat \theta)}^{T}{\Sigma}^{-1}(\theta-\hat\theta) 因此,我将导数wrt取到θθ\theta,首先是有转置,其次是矩阵。所以,我被困住了。 注意:如果我的教授遇到此问题,则是指该讲座。


3
R中的列式矩阵归一化
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 6年前关闭。 我想在R中执行矩阵的列式归一化。给定一个矩阵m,我想通过将每个元素除以该列的总和来归一化每个列。一种执行此操作的方法如下: m / t(replicate(nrow(m), colSums(m))) 有没有更简洁/更优雅/更有效的方法来完成相同的任务?

4
关于矩阵微积分的教科书?
请参阅Math SE上的此问题。 短篇小说:我读了《统计学习的要素》,在尝试验证某些结果时感到沮丧,例如,给定 然后 我我正在寻找一本与您的传统微积分书类似的矩阵微积分书(例如,定理证明,示例,计算练习等)。我已经看过这个问题RSS (β)= (Ý - X β)Ť(ÿ - X β),的RSS(β)=(ÿ-Xβ)Ť(ÿ-Xβ),\text{RSS}(\beta) = \left(\mathbf{y}-\mathbf{X}\beta\right)^{T}\left(\mathbf{y}-\mathbf{X}\beta\right)\text{,}∂的RSS∂β= - 2 XŤ(ÿ - X β)∂2的RSS∂β ∂βŤ= 2 XŤX。∂的RSS∂β=-2XŤ(ÿ-Xβ)∂2的RSS∂β ∂βŤ=2XŤX。\begin{align}&\dfrac{\partial\text{RSS}}{\partial \beta} = -2\mathbf{X}^{T}\left(\mathbf{y}-\mathbf{X}\beta\right) \\ &\dfrac{\partial^2\text{RSS}}{\partial \beta\text{ }\partial \beta^{T}} = 2\mathbf{X}^{T}\mathbf{X}\text{.} \end{align}觉得马格努斯(Magnus)和诺德克(Neudecker)的文字过于注重理论,而我的温特尔(Gentle)的文字则很少关注理论,而在计算方面则过于关注。 有没有快乐的媒介可供具有本科分析背景的人访问?

5
为什么要用低秩近似值打扰?
如果您的矩阵具有n行和m列,则可以使用SVD或其他方法来计算给定矩阵的低秩近似。 但是,低阶近似仍将具有n行和m列。假设您拥有相同数量的特征,低秩近似对于机器学习和自然语言处理如何有用?

11
矩阵“列数”的术语
是否有一个英文单词表示矩阵的“列数”? 例如,2 × 32×32\times 3 × 3矩阵的“维数”是2 × 2 × 32×32\times 3。在此示例中,我需要3项333。当然,我总是可以说“列数”,但是我可以说一个字吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.