Pages

Tuesday, December 14, 2010

SC10: Green500 and Booth "Awards"

好吧我食言了,我还是准备再翻译一篇 Steve Keckler 关于 SC'10 blog,主题是关于绿色计算。在国内的 bbs 上,有人戏称之为和谐计算--一个非常应景的主题。可以看到 NVIDIA 把绿色计算作为噱头来吸引眼球是有来头的。在单线程性能糟糕的情况下,NVIDIA 抛出以下三条断言。第一,将来的应用大多数将是面向吞吐率的;第二,GPU 能够以牺牲单线程性能为代价获得极高的吞吐率;第三,为了获得相应的吞吐率表现,GPU 付出的能耗代价较之 CPU 不值一提。这三点从逻辑上环环相扣,几乎无懈可击。

---------------大家好,我是分割线---------------

就像“更高,更快,更强” (Citius, Altius, Fortius) 的奥林匹克精神一样, SC10也有一系列关于高性能计算机的榜单,而不仅仅是最初的 Top500。绿色500  (The Green500) 是由 Virginia Tech Wu Feng 和其他一些人在 2007 年发起的。其目的在于增进对于高性能计算机系统中功耗效率的关注。这个榜单已经演化成为各大计算机供应商和超级计算中心标榜自己的工具。在介绍这个榜单的时候,Wu 表达了对于这个榜单可能被滥用和戏弄的忧虑。他提出了几点让此份榜单更有实际意义的建议,比如将测试程序扩展到 LINPACK 以外和制定更为严格的评测和报告功耗数据的标准。

Wu 邀请了国家超级计算应用中心 (National Center for Supercomputing Applications, NCSA) Craig Steffen 做了一个关于他们是如何评测 Green500 要求的相关数据的方法论(他们称之为EcoG)的报告。Craig 搞了些很酷的照片,展示了他们是如何把一个夹子式的电流探测器嵌入到一个PDU (power distribution unit) 里面去的。其输出直接和一个采集一秒间隔瞬时功耗的数据采集器相连。不过别在家里尝试这玩意儿--那些 PDU 是工作在 208V 下的。被测试的 PDU 是总共工作的 128 个中的 8 个,这符合 Green500 的规定,也即允许通过汇报一个系统中子系统的数据并扩展到整个系统的方法来报告整个系统的数据。Craig 展示了一些在跑多遍 LINPACK 程序是功耗随着时间变化的图片,非常酷。即使是在一遍运行内,功耗也有 15%(峰值到峰值)的波动,并且平均功耗其实是随着运行的进行减少的。Craig 指出他们还想从 200 毫秒(他们电流采样器的最高分辨率)开始以更细的粒度来抓取数据。这样他们就可以把功耗变化和应用程序的行为更好的联系起来。另一个有趣的方面是 EcoG 决定汇报一遍 LINPACK 运行之后 80%  performance/Watt  数据(从 10% 开始)而不仅仅限于 Green500 规定的 20% 的下限。他们认为去掉启动和完结阶段的中间 80% 的数据相比选取最优的 20% 的数据更有代表性。我倒是很好奇其他那些机器上面功耗是怎么随着时间推移变化的。

在吊足大家胃口之后,Wu 终于发布了 Green500 Top10 的排名。其中 8 个都是异构系统(或者基于 Cell,或者基于 GPU)。他还颁发了一下三个 Green500 奖项:
  • “世界最和谐超级计算机” (Greenest Supercomputer in the World) 奖颁给了位于 IBM 研究院的 IBM BlueGene/Q 原型系统。这个计算机以 1684 MFlops/Watt  (总共 38KW)的数据领衔榜单。我之后顺道去 IBM 的摊位上瞅了一眼他们的硬件系统。虽然没有我在前几天提到的 Blue Waters 那么有气场,但是 BlueGene/Q 还是用了一组定制技术包括一个由 BlueGene 芯片和最多 16GB 的本地存储组成的定制节点卡。这个系统也是水冷的,去除掉了一些诸如风扇电源之类的东西,并且很有可能通过运行在低温下降低了漏电功耗。
  • “世界最和谐超级计算机产品”(Greenest Production Supercomputer in the World) 奖颁给了 Tokyo Institute of Technology Tsubame 2.0。它以 958 MegaFlops/Watt  (总共1244 KW)的数据排名榜单第二。Tsubame 2.0 已经被实际部署了--它为每两个 Intel Westmere CPU 配备了 3 NVIDIA Tesla 20 系列的 GPU。这个 GPU/CPU 比例比榜单靠后的其他超级计算机都要来得高。
  • “世界最和谐自建计算机” (Greenest Self-Built Computer in the World) 奖颁给了 NCSA EcoG。它以 933 MegaFlops/Watt (总共36KW)的数据名列第三。EcoG是一个和 NVIDIA Research 合作的学生项目(我几天前提到了这个机器)。EcoG 采用了 1:1 GPU/CPU 芯片,但是使用了Core i3 代替更高端 CPU 芯片以期以牺牲串行性能的代价获得更好的 CPU 能耗效率。值得一提的是 EcoG 是由一些在网上就能买到的日常组件搭建而成的。

---------------大家好,我是分割线---------------

最后 Steve 的一些闲聊的话就省略了。可以看到忝列 Top500 榜单第一的天河-1A Green500 Top10 中却没了踪影。这么一大坨废铜烂铁,不能跑实际应用,还是吃电怪兽,真是一朵奇葩啊。

No comments: