去年秋天,我参观了伊利诺伊大学的Blue Waters超级计算机。我问是否有人使用过整个计算机。有人告诉我它总是在多个项目上工作。这让我想知道超级计算机的用途。也许蓝色水域是不寻常的,因为它必须由工业界和大学共享-我不知道。我认为管理单个超级计算机的处理器和内存会产生一些开销。构建小型计算机是否更具成本效益?谁能帮助我了解超级计算机的价值?还是有时它们专门用于单个项目?
去年秋天,我参观了伊利诺伊大学的Blue Waters超级计算机。我问是否有人使用过整个计算机。有人告诉我它总是在多个项目上工作。这让我想知道超级计算机的用途。也许蓝色水域是不寻常的,因为它必须由工业界和大学共享-我不知道。我认为管理单个超级计算机的处理器和内存会产生一些开销。构建小型计算机是否更具成本效益?谁能帮助我了解超级计算机的价值?还是有时它们专门用于单个项目?
Answers:
Blue Waters上的一项典型工作是使用约10%的机器,并且总共消耗75个节点小时。蓝水公司大约有27500个节点,因此这意味着其中一些“ 75个节点小时”的工作仅需几分钟即可运行。这样一来,科学家就可以以交互方式使用机器。(您可以在此处查看移动平均值:http : //xdmod.ncsa.illinois.edu/#tg_usage : group_by_Jobs_none)
超级计算机只是小型计算机的大集合。我们将它们汇总到一个地方的主要原因是,我们可以通过这种方式最有效地分摊成本。您正在尝试创建一台可以完成很多工作的计算机,并在其整个生命周期内将总拥有成本(计算机,电源和维护的总成本)降至最低。
总拥有成本涉及多个因素:设备成本是其中之一。为了最大程度地降低拥有成本,您希望设备在尽可能多的时间内(有用的时间为100%,实际上更少,例如95%被认为是良好的)从事有用的工作,直到设备耗尽或变得过时。相比之下,笔记本电脑或手机中的计算机实际使用时间可能不到拥有它的时间的10%(33%的时间您处于睡眠状态,清醒时的一半时间在饮食和放松,并且即使您正在“使用”计算机,处理器大部分时间都处于空闲状态。)
第二是电力成本。其中有几个部分:第一个是电源本身的成本。从发电厂向计算机传输电力会消耗掉一部分成本。它的一部分丢失在计算机的“电源”中(这只是将交流电转换为直流电)。通常,可以使较大的AC-> DC转换器更高效。另外,计算机将有用的电能转化为废热。因此,您还需要付费消除热量。同样,大型空调通常比多个小型空调更高效。
第三是维护成本。通过组装一堆计算机并对其进行设计,以便当其余计算机停机时,它们可以继续运行,比起所有节点都不同且位于不同建筑物中的计算机节点,您可以摊销更大数量的计算机节点上的维护人员成本(或城市)。
详细信息:Blue Waters有288个机柜。每个机柜有96个“节点”。每个节点都是一台非常普通的高端计算机。大多数节点具有2个运行在2.3GHz的AMD Opeteron 6276处理器和64GB的DRAM。相反,大约1/6个节点具有单个AMD Opteron 6276,NVidia K20 GPU和38GB的DRAM。如果愿意,您可以花3000 美元或4000 美元购买类似于“节点”的东西,然后将其放在客厅中玩视频游戏。蓝水有大约27648个节点。 https://bluewaters.ncsa.illinois.edu/hardware-summary
每个节点的功耗可能会超过500瓦,然后将其转化为热量。如果您的客厅里有一个节点可以玩视频游戏,那不是什么大不了的事情。它会从墙上的插座中消耗一些电能,并产生与小型个人空间加热器差不多的热量。在冬天,那将是一种美好而舒适的感觉。在夏季,您必须更频繁地运行空调,以保持房屋舒适。如果您每天全天运行全功率,那么您的电费将大幅增加,也许是您现在消耗的两倍。
但是,当您将其中的27648个放在一起时,它将消耗约15兆瓦的电能,并会产生大量的热量。像任何大型数据中心一样,Blue Waters真正的工程奇迹就是建筑物本身。这是一个巨大的冷藏箱。蓝水大厦特别有趣,因为它效率极高。实际上,进入建筑物的电源中约有85%用于运行节点。我相信我在某个地方(目前找不到)读到的书中只有15%的电能转换和废热损失了。这比起您客厅中的500瓦游戏计算机要好得多。您可能需要750瓦的“电源”和另外几百瓦的功率才能运行空调。
TL; 博士
让我们放在一起。通过将数千台小型计算机组合在一起并在许多人中分散使用,我们可以使这些计算机大部分时间运行,并以非常有效的方式共享资源。它的费用很多的钱给人们闲置的大部分时间电脑。节省计算成本的最佳方法是让人们共享计算机,这样计算机在大多数时间都很忙。
Blue Waters不仅仅是其中的计算机。它经过专门设计,以尽可能提高功率效率。其中一部分涉及将其放置在发电厂附近,以减少输电线路中的功率损耗。这是包含蓝色水域的香槟白酒部分的卫星图像,以演示:
超级计算机在现代研究中极为重要。取决于供应/需求/管理动态以及持续的升级/更换周期,它们并不总是以总容量使用。国防工业中有大量用于武器模拟的超级计算机(与二战中计算机发明的早期理论/动力之一相匹配,即计算弹道)。这种用途并未得到高度宣传。现代武器模拟是针对核武器的,并且高度分类。这些模拟仅通过计算模拟就可以准确地“测试”新武器的设计。因此,美国甚至拒绝向其他国家(例如中国)出口先进的计算机技术,
还有许多其他用途。它们可用于模拟产品设计动态。例如,Tide公司需要弄清楚如何以最佳方式混合洗衣皂中的不同成分,并使用超级计算机来帮助计算最佳混合量。
大多数超级计算机涉及运行多个不同的项目。它们被用作共享资源,并且管理层具有根据项目的总体负荷,研究价值等选择项目的策略。
超级计算机的基本价值在于,大规模的计算根本无法在总体CPU容量较小的“较小”计算机上运行。但是在过去的十年中,已经发生了向采用“商用”技术(又名COTS)构建超级计算机的重大转变,这降低了它们的价格,并且它们仍然具有很高的性能。
维基百科提到了超级计算机的基本用途,这是部分列表。