决战时机

2016-06-27 11:12
时代报告·中国报告文学 2016年6期
关键词:国防科技大学体系结构异构

随着21世纪之门向人类徐徐开启,超级计算机“并行计算时代”开始遭遇“寒流”。这股“寒流”的显著标志,就是单芯片性能提升受到制备工艺限制而大大放缓。也就是说,科学家们提高超级计算机系统的整体性能,只能依赖于加大系统规模。这样一来,系统性能在突破每秒千万亿次后,就会出现一系列难以逾越的“高墙”:

比如体积,它将有几个足球场那么大。

比如功耗,需要建一个专用的发电站,才能满足它的功耗。

这一个个难以攻克的技术瓶颈,标志着超级计算机纯粹CPU超大规模并行计算技术路线已走进“死胡同”,而需要新的体系结构理论来支撑。

这意味着在高性能计算机新的技术高峰面前,中国等发展中国家的超级计算机发展,和美、日等发达国家都处于同一起跑线,我国在超级计算机领域决战决胜、冲击“珠峰”的时机已经来临!

为超级计算机技术“破冰”的东风是什么?

超级计算机发展之路在何方?

在超级计算机技术发展的十字路口,有人在期待,有人在徘徊,有人在观望,更多的人在躬身探索。

国防科技大学计算机学院大楼旁的银河广场上,一名身材魁梧、浓眉大眼、气宇轩昂的中年军人,时而慢慢踱步,时而驻足沉思,时而抬头仰望一眼广袤的太空。

他就是银河系列超级计算机总设计师杨学军教授。

杨学军手上夹着香烟,一口接一口地抽着,一支接一支地点着。他的思绪,随着缓缓吐出的烟雾,袅袅地飘向太空,飘向世界,飘向深邃的历史……

什么样的体系结构可以破除超大规模并行超级计算机面临的“高大难”(功耗高、体积大、技术实现难)窘境呢?

这个大大的问号,拽着杨学军及其团队成员的思绪快速且不停歇地运转起来。为此,身兼行政领导、型号总师的杨学军,无论工作有多忙,每周都要抽出两天时间与大家交流讨论学术问题,而且常常因此错过吃饭时间。这时他就自掏腰包给大家改善伙食,在饭桌上边吃边继续讨论课题,经常有意想不到的收获。

平时,杨学军和团队成员身上都带着两块手机电池。一旦有新发现,就打电话交流讨论,常常一打就是一两个小时,打到两块电池都没电,打得手机烫耳朵。

他们终于发现了可用于科学与工程计算的64位流处理器,并成功应用于大规模并行系统的构建。这一研究成果,是名副其实的世界首创!

2007年6月,杨学军带领团队完成的流处理器研究论文《64位流处理器体系结构研究》,发表在国际计算机系统结构年会(ISCA)上,并被国际权威期刊《IEEE Transactions on Parallel and Distributed Systems》录取。该论文介绍了国防科技大学自主设计的面向科学计算的64位流处理器和其编程方法。这是国际计算机系统结构年会(ISCA)录取的第一篇来自中国研究机构、由中国学者独立完成的学术论文,也是计算机发展史上第一个由中国人提出的体系结构理论。

论文发表后,在国内外计算机领域引起轰动。

CPU与64位流处理器异构融合体系结构,为世界超级计算机技术突破“冰封期”提供了崭新的思路。

杨学军的《64位流处理器体系结构研究》发表一年后,即2008年6月18日,美国突然宣布:IBM公司采用异构融合体系结构技术成功研制出一台峰值速度每秒1.37578千万亿次的超级计算机,并将其命名为“走鹃”。美国在异构融合体系结构技术领域捷足先登,打响了新一轮决战的第一枪,世界强国在超级计算机领域新的较量正式拉开序幕!

21世纪的中国,别无选择,唯有接招,准备决战!

进攻目标锁定后,攻击路线就是关键。

两年前,杨学军带领大伙探讨64位流处理器Imagine时,他的脑海里就同时思考着另一种与之有着异曲同工之妙的电子芯片——GPU的科学计算问题。也就是说,研制每秒千万亿次超级计算机可走既定的CPU+64位流处理器Imagine异构融合技术路线、也可尝试CPU(通用微处理器)+GPU(专用微处理器)异构融合技术路线。

对于前者,团队已攻关多年,有着比较雄厚的技术积累,成功可能性比较大。而对后者,当时国际上公认GPU最高计算效能仅为20%,根本不可能用于研制超级计算机。

但使用GPU构建超级计算机的优势显而易见:它运算速度快,比CPU高出6倍,能有效缩小机器空间;它能耗低,仅有CPU的五分之一,可有效解决超级计算机高能耗短板;它在市场上流通的品种很多,可供选择性大,而且技术成熟;它价格便宜,可有效提高机器的性价比,让用户用得起……

而将GPU用于超级计算机研制的劣势,同样不容忽视:它能否用于高性能计算机,还是个未知数,探索之路将非常艰难,而且风险很大。

以杨学军为总设计师的总师组,经过深入技术调研、反复权衡利弊,决定大胆尝试CPU+GPU异构融合技术之路。

从每秒10万亿次直接冲刺每秒1000万亿次,走别人没有走过的CPU+GPU技术路线,他们的这一超常决策,在业内引起一片哗然。

“研制超级计算机一般都以10倍速度逐步递增,这已成为国际惯例。从每秒10万亿次直接向每秒1000万亿次跨越,这一步是不是迈得大了点?能跨过去吗?”

“就是把机器做出来了,应用水平能跟上吗?”

“GPU能否用于高性能计算还是个谜,用它研制超级计算机,这是不是太冒险了?”

……

面对沸沸扬扬的疑问,杨学军率领的总师组认为,两步并作一步走的事,虽然国际上少有,但对银河人来说却并不是什么新鲜事。当年慈云桂带领大家研制“远望一号”远洋测量船中心计算机时,不也是从每秒万次直接向每秒100万次冲刺的嘛。当今世界,超级计算机每10年性能提升1000倍,在此情况下,若按照所谓“惯例”,按部就班、亦步亦趋,只能永远处于“跟班”“借鉴”“仰人鼻息”的被动局面。只有从荆棘丛中、险关狭隘另辟蹊径,才能杀出重围,率先“登顶”。至于用于图像处理的GPU能否用于科学计算,杨学军坚定地认为,凭着团队数十年超级计算机教学科研积淀的厚实底蕴,和对64位流处理器研究取得的创新成果、技术基础,定能触类旁通,攻克GPU计算效能这一世界难题。

国防科技大学党委积极支持他们的跨越壮举,向创新团队发出了“我们的胸怀有多宽,我们的事业就有多大”的动员令,鼓励大家确立决战决心,坚定决胜信心。

带着国家重托、民族期望,国防科技大学超级计算机创新“航母编队”,浩浩荡荡向着新的技术彼岸进发!

猜你喜欢
国防科技大学体系结构异构
离散异构线性多智能体系统的输出一致性
基于思维导图的化学知识体系结构构建
软件通信体系结构(SCA)理念下的无线通信系统探究
国防科技大学:天河北斗,铁马金戈
试论同课异构之“同”与“异”
国防科技大学:天河北斗,铁马金戈
小伙500天减肥128斤被大学录取
深度揭示小数本质的课堂教学——四位名师《小数的意义》同课异构的分析与启示
凝聚与铺张——孙绍振教授《以丑、呆为美》两岸同课异构教学观摩后记
认知无线网络中的重点技术和研究