快速和向后稳定(左)
我需要计算很多 3×33×33\times3 矩阵逆(用于牛顿迭代极坐标分解),具有极少数退化案例(<0.1%<0.1%<0.1\%)。 显式逆(通过矩阵次要除以行列式)似乎有效,大约是32到40个融合触发器(取决于我如何计算行列式的倒数)。不考虑det比例因子,它只有18个融合触发器(9个元素中的每个都是ab-cd形式,2个融合触发器)。 题: 有没有一种方法可以计算 3×33×33\times 3 使用少于18个(具有任意标度)或32个(具有适当标度,考虑倒数1 op)的融合触发器? 有没有一种经济的方法(使用〜50 f-flops)来计算a的向后稳定左反转 3×33×33\times 3 矩阵? 我正在使用单精度浮点数(iOS游戏)。向后稳定性对我来说是一个有趣的新概念,我想尝试一下。这是引起这一想法的文章。