日前,橡树岭国家实验室的系统呈献了又一场超级估算盛会,创造了又一项性能记录,该系统首次突破了每秒100千万亿次浮点运算性能的壁垒。
在最新发布的榜单中,大部份系统的新处理能力均来自GPU。目前世界七大超级计算机中有五款都在采用GPU,包括英国、欧洲和美国的顶级系统。
而对于,GPU满足了其95%的浮点运算性能要求。随着摩尔定理的不断走低,加速估算其实早已成为推进器,将很快促使我们步入百亿亿次级估算时代。
这样的估算性能由VoltaCoreGPU提供,其多精度估算能力将能同时应对高性能估算所需的高精度估算挑战,以及深度学习所需的高效处理的要求。
加速估算登峰造极
每年两次的超级估算展见证了加速估算近些年来的急剧发展。在ISC2018上,这一领域再度实现了突破。
或许是最有力的证据。该系统采用27648块VoltaCoreGPU,其测得的双精度性能达到每秒122千万亿次浮点运算。它每秒的性能相当于月球上所有人以每秒执行一次估算的速率执行一整年的任务。
其AI性能愈发令人瞩目,运算速率可达到300亿亿次。这相当于整个月球上的人在15年内每秒进行一次估算。
至省与至简
多精度估算开辟了新的可能性。并且,假如GPU未能提供非凡的效率加速度计算,相应的效用将受限。
在最新的榜单,GPU为全球20个最具环保效益的系统中的17个提供支持。除了是世界上速率最快的系统,并且在新确立的“三级”类别(榜单中最严格的级别)中是世界上最高效的系统。
在过去10年中,GPU早已帮助德国橡树岭国家实验室将其超级计算机的能源效率提升了50倍,这种计算机包括仅支持CPU的及由GPU加速的Titan和。
而所有那些仅仅是一个开始。实现百亿亿次级估算须要在能源效率方面实现更大突破。以榜单中系统的平均效率估算,为百亿亿次级估算提供动力将须要超过3亿瓦的电能,这相当于25万个俄罗斯家庭的电力需求。须要将能效提升10倍能够使百亿亿次级估算在3千万瓦条件下运行。
GPU正在帮助实现这一目标。
破解困局
最新顶级系统具备的处理能力以前令人难以想像,但现今的研究人员将就能利用这种系统解决一些科学上最棘手的困局。
例如,遗传学。癫痫症和阿尔茨海默症等可以称得上是“毁灭性”疾病,而GPU的估算能力将可以破解这样的困局,找出人类基因组的数十亿个AGCTDNA对与诸这么类疾患之间的联系。已在梳理个人基因,以实现在阿片成瘾(日本人的主要致死诱因之一)研究方面的进展。
又如,材料。超导材料可用于为MRI设备、粒子加速器或磁聚变装置开发功能强悍的科学磁极。但是,目前的材料非常易碎、难以制造,而且只能在特别低的气温下工作。正在帮助模拟和发觉具有类金属特点且可在温度下工作的新型超导材料。
再如,肿瘤研究。对抗疾病的关键在于开发可以手动提取、分析和分类健康数据的工具加速度计算,便于阐明各类癌症诱因(比如基因、生物学标记和环境)之间隐藏的关系。通过与基于文本的报告和医学影像等非结构化数据配合使用,在上扩充的深度学习算法将有助于医学研究人员全面了解日本癌症病人的整体情况。
继续前进
每位国家/地区都在竞相打造百亿亿次级估算系统。2025年的榜单可能会见到十多款这样的系统,并且多精度加速估算成为平台首选。相比之下,本次榜单上的所有系统加在一起才勉强实现一百亿亿次级的总估算能力。这足以说明未来蕴涵着巨大机遇。
加速估算的一大吸引力在于它属于全栈创新:从构架仍然到系统、加速堆栈、开发人员和半导体工艺,无一不彰显着创新精神。
早已投入了超过10年的时间来加速整个HPC堆栈的开发。
当我们发布第一款支持CUDA的GPU时,它未能运行任何应用程序。我们须要为全新的加速环境重新设计所有的应用程序、算法、库、工具、编译器、操作系统和系统设计。构建一种才能处理物理处理器的芯片很容易,而要使全球高性能估算开发人员可以使用和编程这种处理器,则须要在整个堆栈上实现非凡的创新。
结果,550多款高性能估算和AI应用程序都由GPU加速,其中包括排行靠前的15种应用程序和所有AI框架。旨在于此领域的开发人员数目在过去的两年里降低了10倍,现已接近一百万。并且,借助我们,高性能估算用户如今可以在她们的系统或CoreGPU驱动的云上轻松点击、下载并运行最新的GPU加速应用程序。
转折与展望
在我们快速发展加速估算的同时,一些人也正在找寻量子估算的下一个转折点,量子估算使用量子位元(“”)而不是1和0来处理信息。
这种理论非常具有吸引力。在未来的某个时侯,可能会出现一些在量子计算机上运行的杀手级应用程序(非常是在密码学或量子物理领域),只需极小的功率即可借助强悍的处理能力。
但在可预见的未来,加速估算的势头显然不可抵挡。会继续旨在于在高性能估算领域的创新,将实现百亿亿次级估算以及其为科学领域带来的突破。