Questions tagged «performance»

有关算法,数据结构,语言和库的执行速度和内存使用情况的问题。

3
MATLAB矩阵乘法(最佳计算方法)
我必须在两个参考系统(轴)之间进行坐标转换。为此,由于使用了一些中间轴,必须将三个矩阵(3 × 33×33\times3)相乘。我考虑过两种解决方法: 方法1:直接进行乘法,即 vF= R1个 [R2 [R3 v一世vF=[R1个 [R2 [R3 v一世v_f = R_1\ R_2\ R_3\ v_i 方法2:分为以下步骤: v3 我= R3 v一世v3一世=[R3 v一世v_{3i} = R_3\ v_i v23= R2 v3 我v23=[R2 v3一世v_{23} = R_2\ v_{3i} vF= R1个 v23vF=[R1个 v23v_f = R_1\ v_{23} 哪里: [R1个[R1个R_1,[R2[R2R_2和[R3[R3R_3是3 × 33×33\times3矩阵 vFvFv_f,,,是向量v 3 i v 23 …

10
是否可以优化此集成代码,使其运行更快?
double trap(double func(double), double b, double a, double N) { double j; double s; double h = (b-a)/(N-1.0); //Width of trapezia double func1 = func(a); double func2; for (s=0,j=a;j<b;j+=h){ func2 = func(j+h); s = s + 0.5*(func1+func2)*h; func1 = func2; } return s; } 上面是我的C ++代码,用于func()极限之间的一维数字积分(使用扩展的梯形规则)[ a ,b ][a,b][a,b] 使用 …

2
在共享内存中的GPU上查找小型非对称矩阵本征对的最快方法
我有一个问题,我需要找到一个小的(通常小于60x60)非对称矩阵的所有正对(如特征值为正)。当特征值小于某个阈值时,我可以停止计算。我知道特征值是真实的。关于可以用来尝试获得最佳性能的算法有何建议?我必须进行数千次分解,因此速度很重要。 先感谢您。 编辑:我需要在共享内存的GPU上执行此操作。矩阵也不必相同大小。我目前不知道有任何图书馆可以这样做。将会提出非常适合该问题的算法建议。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.