为什么Householder反射不能对角化矩阵?


16

在实践中计算QR因式分解时,人们使用Householder反射将矩阵的下部归零。我知道,要计算对称矩阵的特征值,您对Householder反射所做的最大努力就是将其变为三对角形式。有什么明显的方法可以看出为什么不能以这种方式完全对角线化吗?我只想简单地解释一下,但无法给出清晰的介绍。

Answers:


12

当计算对称矩阵的特征值MRn×n可以用的Householder反射器做了最好的是驱动器M到三对角形式。正如在前面的回答被提及,因为M是对称存在正交相似变换,其结果在对角矩阵,即,D=STMS。如果我们可以通过计算一系列反射器并将左起的H T分别应用于MH,可以使用Householder反射器严格地找到未知正交矩阵的作用,那将很方便。SHTMH从向右M。但是,由于Householder反射镜被设计为将列归零,因此这是不可能的。如果我们要计算Householder反射器以将以下的所有数字归零,则发现 M = M11 但是现在,条目 M 12 - M 1 n已通过左侧应用的反射器 H T 1进行了更改。因此,当我们在右边应用 H 1时,它将在M的第一行中不再为零,仅留下 M 11。相反,我们将获得 H T 1 M=

中号=H1个Ť中号=0000
中号12-中号1个ñH1个ŤH1个中号中号11 我们不仅不将行排零,而且可能破坏我们刚刚使用反射器 H T 1引入的零结构。
H1个Ť中号=0000H1个Ť中号H1个=''''''''''''''''''''''''''''''''''''''''
H1个Ť

但是,当您选择将驱动到三对角线结构时,您将保持第一行不受H T 1的影响,因此 M = 中号H1个Ť 因此,当我们从右边应用相同的反射器时,我们可以获得 H T

中号=H1个Ť中号=000
H1个Ť中号=000H1个Ť中号H1个=000''''''''0''''''''0''''''''0''''''''

应用递归这使我们能够推动的三对角矩阵牛逼。如前所述,您可以使用Golub和Van Loan的Matrix Computations中的 Jacobi或Givens旋转有效地完成M的对角线化。家用反射器和Jacobi或Givens旋转序列的累积作用使我们能够找到正交矩阵S TS的作用而无需明确地形成它们。中号Ť中号小号Ť小号


11

正如对其他答案的评论所阐明的那样,这里的真正问题不是Householder矩阵的缺点,而是一个问题,为什么要使用迭代而不是直接(“封闭形式”)方法对角化(实际)对称矩阵(通过正交)相似)。

实际上,任何正交矩阵都可以表示为Householder矩阵的乘积,因此,如果我们知道对称矩阵的对角线形式(其特征值),则可以求解一整套正交归一化的特征向量并将基础矩阵的相应变化表示为多项式时间内Householder变换的乘积。

因此,让我们转向Victor的括号内注释“除Abel定理外”,因为我们正在有效地询问为什么应使用迭代方法找到多项式的根,而不是直接方法。当然,实对称矩阵的特征值是其特征多项式的根,也可以朝另一个方向移动。给定只有实数根的实多项式,可以从多项式的Sturm序列构造三对角对称伴随矩阵。另请参阅海报中的丹尼斯·塞雷(Denis Serre)的练习92这一套. This is rather nice for showing the equivalence of those problems since we've seen (@AndrewWinters) the direct application of Householder matrices will tridiagonalize a real symmetric matrix.

Analysis of the arithmetic complexity for an iterative (root isolation) method is given in Reif (1999), An Efficient Algorithm for the Real Root and Symmetric Tridiagonal Eigenvalue Problems. Reif's approach improves on tailored versions of QR for companion matrices, giving O(nlog3ñ 代替 Oñ2 复杂。

阿贝尔-伽罗瓦-鲁菲尼定理说,对上述四个多项式的根没有通式可以在基团(和通常的算术)方面进行说明。但是,对于更多的异国操作,存在根的封闭形式。原则上,可以将特征值/对角线化方法作为此类方法的基础,但有人会遇到一些实际困难:

  1. 在这方面,Bring根基(又称超自由基)是一个变量的函数,就像求平方根一样。杰拉德(Jerrad,c。1835年)指出,求解一般五次方程可简化为求解Ť5+Ť-一种=0,使单变量函数 Ť一种 (除了部首和其他常用的算术运算法则使用)允许求解所有五次子。

  2. 尽管可以找到仅使用两个变量的函数来解决它们的各种方法,但它会分解为六次及以上的多项式希尔伯特的第13个问题是这样的猜想:仅使用最多两个变量的函数就无法求解一般的七阶多项式,但是1957年,阿诺德(VI Arnold)证明了。Mellin积分,超几何和Siegel theta函数可用于获取任意次数多项式的解。

  3. 除了实现不止一个参数的某种特殊奇特函数外,我们还需要直接方法来求解适用于一般学位的多项式 ñ rather than ad hoc or degree specific methods. Guàrdia (2002) gives "a very simple expression of the roots of a polynomial of arbitrary degree in terms of derivatives of hyperelliptic theta functions." However this approach requires making choices of Weierstrass points on hyperelliptic curve Cf:Y2=f(x) where all roots of polynomial f(x) are sought. A good choice leads to expressing less than half of those roots, and it appears this approach requires repeated trials to get all of them. Each trial involves solving a homogeneous linear system at O(n3) cost.

Therefore the indirect/iterative methods for isolating real roots (equiv. eigenvalues of symmetric matrices), even to high precision, currently have practical advantages over the known direct/exact methods for these problems.


一些注意事项:1. FiedlerSchmeisser在论文中概述了一种从Sturm序列构建三对角伴侣矩阵的实用方法;我在这里给出了Mathematica的实现,以较传统的语言实现它应该不难。
JM

2. With respect to the "theta function" approach for polynomial roots (which I agree is a bit too unwieldy for practical use), Umemura outlines an approach using Riemann theta functions.
J. M.

2

您基于什么原因认为这是不可能的?

任何对称实矩阵 小号 可以正交对角线化,即 小号=GdGŤ,在哪里 G 是正交的 d 是对角线的。

大小为n×n的任何正交矩阵都可以构造为最多n个此类反射的乘积。维基百科。因此,您有这种分解。

我不确定最后的陈述,我只是引用它(我认为它是正确的)。据我了解您的问题,可以归结为是否可以将任何正交矩阵分解为Householderer变换序列。


2
我应该更具体一些。对角化对称矩阵的第一步是应用Householder直到其为三对角线。接下来,执行QR迭代。仅使用封闭形式的Householder转换无法完成此过程。为什么?(Abel定理除外)
Victor Liu

1
您可以通过Jacobi旋转来实现。Golub和Van Loan写道Jacobi与Givens一样。户主只是做纪梵希的另一种方式。实际上,QR的“正确”方法可能更快。
供电

1

如果特征值是已知的(通过基于常规方法的初步计算),则可以使用它们对一个非对称矩阵进行三角剖分(或对角化一个对称矩阵)。 ñ-1个户主的思考。在里面ķ第一步 ķ第th列变为三角形。(这也提供了Schur因式分解存在的简单归纳证明。)

它实际上对于重复需要数字稳定因子形式的正交矩阵的方法很有用。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.