当前可用的GPU是否支持双精度浮点运算？

17

我已经在包含24个Intel Xeon CPU的节点组成的Ubuntu Linux集群上运行了分子动力学（MD）代码GROMACS。我的兴趣点对浮点算术精度有些敏感，因此我不得不以双精度而不是单精度运行GROMACS-尽管双精度的计算成本较高。因此，在群集上，我以双精度方式编译了GROMACS。

我正在考虑购买一些GPU，因为可能会有相对于CPU的加速（“ GPU加速”）。但是，我需要一个可以执行双精度算术的GPU。您知道这样的硬件是否可以在市场上买到吗？一个在GROMACS邮件列表上最近的文章表明，双精度的GPU市场上不能获得：

硬件尚不支持[双精度算术]，但AFAIK。

这个Wikipedia页面似乎暗示双精度GPU并不常见，因为它们可能效率不高：

Nvidia GPU上的浮点实现大部分符合IEEE标准。但是，并非所有供应商都这样。这对正确性有影响，对于某些科学应用而言，正确性被认为很重要。虽然在CPU上通常可以使用64位浮点值（双精度浮点数），但GPU并不普遍支持这些值。有些GPU架构牺牲了IEEE遵从性，而另一些则完全缺乏双精度。已经进行了一些努力来在GPU上模拟双精度浮点值。但是，速度折衷首先抵消了将计算量卸载到GPU上的任何好处。

此NVIDIA的Tesla页，在图表中引用“峰值双精度浮点性能”，似乎表明，双精度计算可以，其实，做他们的GPU（虽然在更高的计算成本）。

那么，我应该相信什么？您对此问题有经验吗？

— 安德鲁
source

签出gtx titan，它基于gk110，并具有双重精度支持..虽然它有点

Wikipedia并不总是具有有关快速变化的主题的最新信息……

— Jeff

17

双精度在较新的GPU上相当普遍。例如，我拥有一个NVIDIA GTX560 Ti（在计算方面相当低端），以双精度运行ViennaCL没问题。从这里（第4节）看来，所有GTX4xx以上的NVIDIA卡都原生支持双精度。

我猜想GROMACS信息已经过时了。

— 戈德里克·先知
source

5

很落伍。特别是NVIDIA处理器，多年来一直具有双精度支持。坦白说，它比单精度功能要慢得多，但是它在特斯拉品牌的第一个GPU中就存在（并且不仅是模拟的），而且可能在此之前。最近的化身大大减小了信号和双精度支持之间的差距。

— 迈克尔·格兰特

是的，我链接的论文提到了在需要仿真时性能大约相差8倍的数字，但是现在针对芯片进行了设计，它接近2倍。我想说这很可能是由于从VRAM到处理器的存储卡延迟，但这只是我的猜测。

— Godric Seer 2013年

实际上，主要原因是早期的GPU并没有在双精度计算上投入太多的芯片空间。根据此页面，GK110系列的每个“ SMX块”（无论是什么意思）的双精度单位是GK104系列的8倍。

— 迈克尔·格兰特

1

嗯，是的，我实际上指的是当前GPU在内存带宽方面的2倍差异。

— Godric Seer

知道了我不是故意要去这个兔子洞的。您的回答很好，这就是为什么我评论并投票给您，而不是添加我自己的回答;-)

— Michael Grant

8

每个具有SM 1.3（Tesla / GTX2xx）或更高版本的GPU都具有硬件双精度支持。从Fermi架构开始，Quadro和Tesla变体比消费者Ge Force机型具有更好的双精度支持。

奇怪的是，Ge Force Kepler / GTX6xx双精度支持不如GeForce Fermi / GTX5xx支持以改善Kepler K20 / K20x的Tesla差异性。奇怪的是，Tesla K10拥有Ge Force级的双精度支持。最近，Ge Force GTX Titan的推出使这一问题彻底混乱了，它具有完全的双精度支持和许多CUDA功能，这些功能仅在特斯拉模型中才存在。GTX Titan售价约1000美元-讨价还价的IMO。

2

您还应该阅读GROMACS邮件列表中的后续帖子：http : //lists.gromacs.org/pipermail/gmx-users/2013-April/080604.html。MD中的GPU实现是否在相当程度上支持双精度的使用至少与硬件上是否具有双精度一样重要。

— 马布拉汉
source

0

根据讨论，特斯拉和泰坦GPU最适合（双倍于Nvidia GPU）双精度。

例如，查看Wikipedia上的Nvidia GPU列表（此处是AMD GPU的类似表），并比较单精度和双精度处理能力（就GFLOP而言），您会发现双精度性能远小于单精度的一半。其他大多数GPU的性能。例如，对于GTX 900系列，文章提到双精度性能是单精度性能的1/32，而此维基百科文章说，对于GTX 700系列，双精度性能是单精度性能的1/24。性能（Titan除外，它可以高达单精度性能的1/3）。

— 安德烈·霍尔兹纳（Andre Holzner）
source