对数-对数并行缩放/效率图


17

我的许多工作都围绕使算法更好地扩展而展开,而显示并行扩展和/或并行效率的首选方法之一是在内核数量上绘制算法/代码的性能,例如

人工平行比例图

其中,轴表示核心数,轴表示某种度量,例如,每单位时间完成的工作。不同的曲线显示在64个磁芯上的并行效率分别为20%,40%,60%,80%和100%。Xÿ

但不幸的是,在许多出版物,这些结果绘制了对数标度,例如在结果文件。这些对数-对数图的问题在于,评估实际的并行缩放/效率非常困难,例如

在此处输入图片说明

与上面的图相同,但具有对数-对数缩放。请注意,并行效率为60%,80%或100%时,结果之间没有太大差异。我在这里对此进行更广泛的写作。

所以这是我的问题:在对数对数缩放中显示结果有什么理由?我经常使用线性标度来显示自己的结果,并经常被裁判员锤击,说我自己的并行标度/效率结果看起来不如其他人的(对数-对数)结果,但在我的生命中,我无法看到为什么我应该切换绘图样式。

Answers:


16

我们目前正在写一篇包含许多可比较图的论文,而我们或多或少都遇到了同样的问题。本文是关于在BlueGene上比较不同算法在内核数量上的缩放比例,内核数量在1到100k之间。在这种情况下使用loglog-plots的原因是涉及的数量级数量。没有人可以在线性比例上绘制6个数量级的图。

确实,当在loglog中根据内核数绘制时间时,算法不是很容易区分,如下图所示。 对数尺度上许多算法的时间安排。 不同的算法很难区分。

Ëp=Ť1个/pŤpŤ1个ŤpppËpp

Ëp=Ť[RËF/pŤpŤ[RËF

在半对数标度上绘制相对并行效率可以非常清楚地显示算法的标度,并且还可以显示算法之间的相对性能。 多个算法在内核数量上的相对并行效率。


2
X

请注意,这些图看起来并不像其他比例图那样令人印象深刻,因为它们在对数刻度上很快下降。此外,理论上您还可以在对数图中绘制效率,以在右侧查看更多详细信息。但是请注意,这意味着您需要仔细研究效率很低的情况,而这可能并不是人们所感兴趣的。
olenz 2013年

14

乔治· 黑格( Georg Hager)在《愚弄群众-绝技3》中写道。原木秤是您的朋友

虽然确实没有发现高端的对数-对数图很明显,但它们允许显示更多数量级的比例。要了解为什么这样做有用,请考虑定期完善3D问题。在线性范围内,您可以合理地显示大约两个数量级的性能,例如1024个内核,8192个内核和65536个内核。读者无法从图中判断出您是否跑得更小,实际上,图中大部分只是比较最大的两次运行。

现在假设我们可以在内存中为每个内核容纳一百万个网格单元,这意味着在两次按8倍的强缩放后,每个内核仍然可以有16k单元。这仍然是一个相当大的子域大小,我们可以期望许多算法可以在那里高效运行。我们已经介绍了图表的可视范围(1024到65536个核),但是甚至还没有进入难以扩展的范围。

假设我们从16个内核开始,每个内核也有100万个网格单元。现在,如果我们扩展到65536个核心,则每个核心只有244个单元,这将变得更加挑剔。对数轴是清楚表示从16个核到65536个核的频谱的唯一方法。当然,您仍然可以使用线性轴,并带有标题为“图形中的16、128和1024核心的数据点重叠”的标题,但是现在您使用的是单词而不是图形本身来显示。

对数对数刻度还允许您进行缩放以从机器属性中“恢复”,例如移动到单个节点或机架之外。是否可取取决于您。


Xÿ轴上,即仍然无法判断实际效率。无论如何,我都会考虑在单个节点,少量节点和数千个节点上进行缩放是单独的问题,我认为,这些问题应该单独绘制线性缩放图,每个图都始于单个核心,节点或节点。分别为1000个节点。
Pedro

1
它是更难较强的规模通过4096倍的单个问题,而不是比例2种不同问题尺寸通过每个64的一个因素。在我给出的示例中,很容易使两个独立的案例显示出优于95%的效率,但是使单个组合案例的效率低于30%。在科学和工业中,没有预定的理由使所需的周转时间落在算法“舒适”的狭窄尺寸范围内。
杰德·布朗

我完全同意,从一个规模扩展到数千个挑战是巨大的!我认为不同幅度是不同问题的原因是,这对于最终用户将意味着不同的事情。以医学博士为例,大多数生物学家在地下室都没有BlueGene,但是确实有一些多核工作站,甚至在中等规模的集群(节点数量少)上有一段时间的拨款,并且人们看着但是,CFD问题对于单节点情况并不太在乎,因为该问题不适合内存使用。这与算法的舒适性无关,而与用户的设置有关。
Pedro

2

我同意杰德在回应中所说的一切,但我想补充以下内容。我一直很喜欢Martin Berzins和他的同事展示其Uintah框架的扩展方式。他们在对数-对数轴上绘制了代码的弱缩放比例和强缩放比例(使用方法的每个步骤的运行时间)。我认为它显示了代码如何很好地缩放(尽管很难确定是否偏离完美缩放)。参见第7页和第8图7和图8 这个例如*纸。他们还提供了一张表格,其中包含与每个比例尺数字相对应的数字。

这样做的好处是,一旦您提供了数字,评论者便无话可说(或者至少您无法反驳)。

* J。Luitjens,M。Berzins。“提高Uintah的性能:大规模自适应网格计算框架”,在第24届IEEE国际并行和分布式处理研讨会(IPDPS10)的会议记录中,佐治亚州亚特兰大,第1--10页。2010.DOI10.1109 / IPDPS.2010.5470437


您是否有可能将图像直接嵌入答案中?
阿隆·艾玛迪亚

虽然可以合理地借用他们的数据,但我宁愿吸引访问者访问网站。也许我将组成一些数字和自己的图表,然后再返回一个数字。
Bill Barth

从这个角度来看,您可以包装图像,使其链接到作者的网站,并增加链接中的文本量。如果您想进一步讨论,我可以打开一个meta / chat线程。
阿隆·艾玛迪亚

@BillBarth您的链接现在重定向到其主页。您可以修复它还是嵌入预期的图像?
杰德·布朗

1
@JedBrown链接已编辑。已添加完整参考。DOI添加了。
比尔·巴特
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.