4
最快的线性系统求解小平方矩阵(10x10)
我对通过线性系统求解小矩阵(10x10)(有时也称为小矩阵)来优化地狱非常感兴趣。有没有现成的解决方案?矩阵可以假定为非奇异的。 此求解器将在Intel CPU上执行超过1000000次(以微秒为单位)。我说的是计算机游戏中使用的优化级别。无论是在特定于汇编和体系结构的代码中进行编码,还是研究精度或可靠性方面的折衷并使用浮点hack(我都使用-ffast-math编译标志,这都没有问题)。解决甚至可能在大约20%的时间内失败! Eigen的partialPivLu在我当前的基准测试中是最快的,当使用-O3和良好的编译器进行优化时,性能优于LAPACK。但是现在我要手工制作一个定制的线性求解器。任何建议将不胜感激。我将使我的解决方案开源,并会在出版物等方面获得关键见解。 相关:用块对角矩阵求解线性系统 的速度什么是最快的方法来反转数百万个矩阵? https://stackoverflow.com/q/50909385/1489510