超级计算机的目的


15

去年秋天,我参观了伊利诺伊大学的Blue Waters超级计算机。我问是否有人使用过整个计算机。有人告诉我它总是在多个项目上工作。这让我想知道超级计算机的用途。也许蓝色水域是不寻常的,因为它必须由工业界和大学共享-我不知道。我认为管理单个超级计算机的处理器和内存会产生一些开销。构建小型计算机是否更具成本效益?谁能帮助我了解超级计算机的价值?还是有时它们专门用于单个项目?


您能解释一下这是计算机科学的问题吗?Afaik,超级计算机的大多数用户是自然科学和科学计算人员。
拉斐尔

@Raphael:这是有关计算机系统设计中资源分配的问题。任何种类的计算机系统的用户很少是计算机科学家。
2015年

1
您是否有更多有关Blue Waters用法的详细信息?例如,假设通常有一个项目使用了90%的计算机,而另一些项目则使用了剩余的10%:在这种情况下,看起来计算机的大小合适。但是,如果通常有10个项目每个使用10%的资金,那将是完全不同的选择。
David Richerby

2
对我来说听起来像计算机科学。计算机体系结构,集群计算,网格计算等。所有相关和所有计算机科学。
Dave Clarke

Answers:


9

Blue Waters上的一项典型工作是使用约10%的机器,并且总共消耗75个节点小时。蓝水公司大约有27500个节点,因此这意味着其中一些“ 75个节点小时”的工作仅需几分钟即可运行。这样一来,科学家就可以以交互方式使用机器。(您可以在此处查看移动平均值:http : //xdmod.ncsa.illinois.edu/#tg_usage : group_by_Jobs_none

超级计算机只是小型计算机的大集合。我们将它们汇总到一个地方的主要原因是,我们可以通过这种方式最有效地分摊成本。您正在尝试创建一台可以完成很多工作的计算机,并在其整个生命周期内将总拥有成本(计算机,电源和维护的总成本)降至最低。

总拥有成本涉及多个因素:设备成本是其中之一。为了最大程度地降低拥有成本,您希望设备在尽可能多的时间内(有用的时间为100%,实际上更少,例如95%被认为是良好的)从事有用的工作,直到设备耗尽或变得过时。相比之下,笔记本电脑或手机中的计算机实际使用时间可能不到拥有它的时间的10%(33%的时间您处于睡眠状态,清醒时的一半时间在饮食和放松,并且即使您正在“使用”计算机,处理器大部分时间都处于空闲状态。)

第二是电力成本。其中有几个部分:第一个是电源本身的成本。从发电厂向计算机传输电力会消耗掉一部分成本。它的一部分丢失在计算机的“电源”中(这只是将交流电转换为直流电)。通常,可以使较大的AC-> DC转换器更高效。另外,计算机将有用的电能转化为废热。因此,您还需要付费消除热量。同样,大型空调通常比多个小型空调更高效。

第三是维护成本。通过组装一堆计算机并对其进行设计,以便当其余计算机停机时,它们可以继续运行,比起所有节点都不同且位于不同建筑物中的计算机节点,您可以摊销更大数量的计算机节点上的维护人员成本(或城市)。

详细信息:Blue Waters有288个机柜。每个机柜有96个“节点”。每个节点都是一台非常普通的高端计算机。大多数节点具有2个运行在2.3GHz的AMD Opeteron 6276处理器和64GB的DRAM。相反,大约1/6个节点具有单个AMD Opteron 6276,NVidia K20 GPU和38GB的DRAM。如果愿意,您可以花3000 美元或4000 美元购买类似于“节点”的东西,然后将其放在客厅中玩视频游戏。蓝水有大约27648个节点。 https://bluewaters.ncsa.illinois.edu/hardware-summary

每个节点的功耗可能会超过500瓦,然后将其转化为热量。如果您的客厅里有一个节点可以玩视频游戏,那不是什么大不了的事情。它会从墙上的插座中消耗一些电能,并产生与小型个人空间加热器差不多的热量。在冬天,那将是一种美好而舒适的感觉。在夏季,您必须更频繁地运行空调,以保持房屋舒适。如果您每天全天运行全功率,那么您的电费将大幅增加,也许是您现在消耗的两倍。

但是,当您将其中的27648个放在一起时,它将消耗约15兆瓦的电能,并会产生大量的热量。像任何大型数据中心一样,Blue Waters真正的工程奇迹就是建筑物本身。这是一个巨大的冷藏箱。蓝水大厦特别有趣,因为它效率极高。实际上,进入建筑物的电源中约有85%用于运行节点。我相信我在某个地方(目前找不到)读到的书中只有15%的电能转换和废热损失了。这比起您客厅中的500瓦游戏计算机要好得多。您可能需要750瓦的“电源”和另外几百瓦的功率才能运行空调。

TL; 博士

让我们放在一起。通过将数千台小型计算机组合在一起并在许多人中分散使用,我们可以使这些计算机大部分时间运行,并以非常有效的方式共享资源。它的费用很多的钱给人们闲置的大部分时间电脑。节省计算成本的最佳方法是让人们共享计算机,这样计算机在大多数时间都很忙。

Blue Waters不仅仅是其中的计算机。它经过专门设计,以尽可能提高功率效率。其中一部分涉及将其放置在发电厂附近,以减少输电线路中的功率损耗。这是包含蓝色水域的香槟白酒部分的卫星图像,以演示: 在此处输入图片说明


4

超级计算机在现代研究中极为重要。取决于供应/需求/管理动态以及持续的升级/更换周期,它们并不总是以总容量使用。国防工业中有大量用于武器模拟的超级计算机(与二战中计算机发明的早期理论/动力之一相匹配,即计算弹道)。这种用途并未得到高度宣传。现代武器模拟是针对核武器的,并且高度分类。这些模拟仅通过计算模拟就可以准确地“测试”新武器的设计。因此,美国甚至拒绝向其他国家(例如中国)出口先进的计算机技术,

还有许多其他用途。它们可用于模拟产品设计动态。例如,Tide公司需要弄清楚如何以最佳方式混合洗衣皂中的不同成分,并使用超级计算机来帮助计算最佳混合量。

大多数超级计算机涉及运行多个不同的项目。它们被用作共享资源,并且管理层具有根据项目的总体负荷,研究价值等选择项目的策略。

超级计算机的基本价值在于,大规模的计算根本无法在总体CPU容量较小的“较小”计算机上运行。但是在过去的十年中,已经发生了向采用“商用”技术(又名COTS)构建超级计算机的重大转变,这降低了它们的价格,并且它们仍然具有很高的性能。

维基百科提到了超级计算机的基本用途,这是部分列表。

  • 1970年代/天气预报,空气动力学研究(Cray-1)。[83]
  • 1980年代/概率分析,[84]辐射屏蔽建模[85](CDC Cyber​​)。
  • 1990年代/暴力破解密码(EFF DES饼干)。[86]
  • 2000年代/ 3D核试验模拟代替法律行为《核不扩散条约》(ASCI Q)。[87]
  • 2010年代/分子动力学模拟(天河1A)[88]

1
近年来,超级计算机与大数据深度学习的
vzn

3
这个问题似乎是这个问题的主要方面:如果一台特定大小的超级计算机总是要同时运行多个项目,那有什么意义呢?如果人们只需要容量为C / 2的计算机,那么拥有一台容量为C的计算机又有什么意义呢?建造两台比一台大计算机更小的小型计算机据推测会便宜些?
David Richerby
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.