Questions tagged «conjugate-gradient»

3
BFGS与共轭梯度法
在BFGS和共轭梯度之间进行优化时,应该考虑哪些因素?我试图适合这些变量的函数是指数函数。但是,实际的目标功能除其他外还涉及集成,如果有帮助的话,则成本很高。

3
求解方程组线性系统的Krylov子空间方法收敛的原理是什么?
据我了解,解决线性方程组的方法有两大类: 固定方法(Jacobi,Gauss-Seidel,SOR,Multigrid) Krylov子空间方法(共轭梯度,GMRES等) 我了解到,大多数固定方法都是通过迭代地放松(平滑)错误的傅立叶模式而起作用的。据我了解,共轭梯度法(Krylov子空间法)通过“逐步”遍历来自应用于第ñnn个残差的矩阵的幂的最佳搜索方向集而工作。这个原理对所有Krylov子空间方法都通用吗?如果不是,那么,一般来说,我们如何表征Krylov子空间方法收敛的原理?

3
共轭梯度比GMRES更好的问题
我对共轭梯度比GMRES方法更好的情况感兴趣。 通常,在许多SPD(对称-正定)情况下,CG是首选,因为它需要较少的存储,并且CG的理论收敛速度是GMRES的两倍。实际观察到这样的费率有什么问题吗?对于相同数量的spmvs(稀疏矩阵矢量乘法),GMRES的性能好于CG或与CG相当吗?


2
梯度下降和共轭梯度下降
对于一个项目,我必须实现这两种方法并比较它们在不同功能上的执行方式。 看来共轭梯度法是要解决的线性方程组 Ax=bAx=b A\mathbf{x} = \mathbf{b} 其中是对称,正定和实数的n×n矩阵。AAA 另一方面,当我阅读有关梯度下降的文章时,我看到了Rosenbrock函数的示例,即 f(x1,x2)=(1−x1)2+100(x2−x21)2f(x1,x2)=(1−x1)2+100(x2−x12)2 f(x_1,x_2) = (1-x_1)^2+100(x_2-x_1^2)^2 如我所见,我无法使用共轭梯度法解决此问题。还是我想念什么?

1
无法进行线搜索时的自适应梯度下降步长
我有一个客观的功能 EEE 取决于一个值 ϕ(x,t=1.0)ϕ(x,t=1.0)\phi(x, t = 1.0),在哪里 ϕ(x,t)ϕ(x,t)\phi(x, t)是PDE的解决方案。我正在优化EEE在PDE 的初始条件下通过梯度下降:ϕ(x,t=0.0)ϕ(x,t=0.0)\phi(x, t = 0.0)。也就是说,我更新ϕ(x,t=0.0)ϕ(x,t=0.0)\phi(x, t = 0.0)然后必须集成PDE以计算我的残差。这就是说,如果我要对梯度下降步长进行线搜索(称它为αα\alpha),对于的每个潜在值 αα\alpha 我将不得不重新整合PDE。 就我而言,这将是非常昂贵的。自适应梯度下降步长还有另一种选择吗? 我不仅在这里寻找数学原理的方案(尽管如果有的话当然会更好),但对通常比静态步长更好的任何事物都会感到满意。 谢谢!

2
共轭梯度的最坏情况复杂度是多少?
令对称且为正定。假设将向量乘以需要个工作单位。众所周知,在条件编号为上执行CG算法需要个工作单位。A∈Rn×nA∈Rn×nA\in \mathbb{R}^{n\times n}mmmAAAAAAκκ\kappaO(mκ−−√)O(mκ)\mathcal{O} (m\sqrt{\kappa}) 现在,当然,作为语句,这是一个上限。CG算法总是可以以零步长的终止值进行幸运的初始猜测。OO\mathcal{O} 我们是否知道是否存在RHS和最初的(不幸的)猜测,这将需要步骤?换句话说,CG的最坏情况下的工作复杂度真的是吗?Θ(κ−−√)Θ(κ)\mathcal{\Theta}(\sqrt{\kappa})Θ(mκ−−√)Θ(mκ)\Theta( m \sqrt{\kappa}) 当我尝试确定预处理器的收益(较低的)是否超过其成本(较高的)时,就会出现此问题。现在,我正在处理玩具问题,并希望在用编译语言实现任何东西之前有一个更好的主意。κκ\kappammm

2
如何消除线性弹性中的刚体运动?
我想解决 Ku=bKu=bK u = b 哪里 KKK是我的刚度矩阵。但是,可能缺少一些约束,因此系统中可能仍然存在一些刚体运动(由于特征值零)。由于我使用CG求解线性系统,因此这是不可接受的,因为有时CG不会收敛于半正问题(但有时我会收敛)。 实际上,我在使用惩罚性置换方法,因为我要添加形式上的惩罚 α||u||2α||u||2 \alpha ||u||^2弹性能量。所以能量读 W(u):=12uT(K+αI)u−btuW(u):=12uT(K+αI)u−btu\begin{equation} \mathcal W(u) := \frac{1}{2} u^T (K + \alpha I) u - b^t u \end{equation} 哪里 αα\alpha与刚度矩阵的一些对角线输入成比例。但这实际上起到了抑制某些时候我想要的变形模式的作用。 我的问题是: a)我可以变换原始系统,所以必须使其不具有奇异性和正定性(例如坐标变换或全等变换或其他)吗?我的想法是使用这种转换在转换后的问题上仍然使用CG b)有什么标准方法可以处理这些奇异现象? 非常感谢你 ! 亲切的问候, 汤姆
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.