Questions tagged «cuda»

1
截至2013年末,CUDA与OpenCL
从程序员的角度来看,CUDA和OpenCL在2013年末之间如何比较?我的小组正在考虑尝试利用GPU计算。通过选择仅支持OpenCL但不支持CUDA的硬件,我们是否会大大限制自己? 具体来说,以下假设是否正确? CUDA中所有可能的功能在OpenCL中也可能 只要我们不使用库,给定的任务就不会很容易(或更难)地完成 CUDA的主要优势是库的可用性 两者都对所有三个主要平台(Win / OSX / Linux)都具有良好的支持。
34 hpc  gpu  cuda  opencl 

3
在GPU上解决无约束的非线性优化问题
我正在尝试解决GPU(CUDA)上的一些不受约束的非线性优化问题。 目标函数是一个平滑的非线性函数,其梯度在分析上相对便宜,因此我无需理会数值逼近。 我想通过大多数fp32数学运算来解决此问题(由于各种原因),那么哪种非线性优化方法对舍入误差更鲁棒,同时又具有良好的性能?(例如共轭梯度/准牛顿/信任区域),有人在GPU上尝试过BFGS并获得良好结果吗? 顺便说一句,如果需要的话,Hessian相对较小(通常小于64x64),但是我需要同时解决数千个此类小规模优化问题。

1
隐式时间离散化的cuda和数值方法
我希望移植一些通过IMPLICIT形式的有限体积方法(用于时间离散化)解析一组偏微分方程(PDE)的代码。 结果,存在由ADI / TDMA方案处理的x,y,z方向上的三对角方程组。 我似乎找不到关于使用CUDA进行PDE的隐式解决方案的任何信息。 ADI / TDMA方案是否可以在CUDA中实现?某处是否有类似2D热扩散方程的示例? 我所能找到的是一个二维热扩散方程的CUDA示例代码,它具有有限的差异,但形式为EXPLICIT(剑桥大学)。 任何提示/参考将不胜感激。

3
推动GPU编程
我对GPGPU编程非常陌生,所以如果这个问题不是特别合适,请原谅我。据我了解,与通常的CPU编程相比,GPU编程是一项非常复杂的工程工作。必须注意发散性问题,切片,固定的内存分配以及主机设备通信/设备计算重叠。 经过一些研究后,我发现了推力库,它似乎试图模仿C ++ STL。很好 但是,基于我非常有限的经验,并且看到了获得良好性能所需的所有微观管理,我对性能有些怀疑。能否有效地内部处理所有复杂的编程部分?一些非常著名的库(例如PETSc)似乎使用了此软件包,这使我相信它应该以某种方式出现。 我想知道,与低级CUDA编程相比,对CUDA有更多经验和推力的人能否对软件包的性能说一两句话。什么时候可以使用推力?什么时候应该切换回CUDA?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.