“中国巨型计算机之父”金怡濂:铸“神威”扬国威

2019-01-16 19:59宗和
风流一代·经典文摘 2019年1期
关键词:神威高性能研制

宗和

“革命加拼命”研制巨型机

金怡濂与计算机结缘,是在新中国成立后的1956年。当时,国家把计算机技术列为科学发展的重点学科之一。不久,20个年轻人被选派赴苏联学习计算机研制,时年27岁、自清华大学电机系毕业后进入研究所工作的金怡濂幸运入选。

“当时,电子计算机刚问世10年。中国没多少人知道什么是计算机,国家急缺人才,与其说我选择了计算机,不如说计算机选择了我。”金怡濂回忆道,他除了听说过“计算机”这个名词外,其他一无所知,更无从预料计算机技术的发展将给全世界带来如此巨大而深刻的影响。但祖国的重托,足以激发他全部的热情,夜以继日地学习。

1958年7月,金怡濂从莫斯科回到北京,随即就被派往中科院计算所,参与中国第一台大型计算机104机的研制。

金怡濂颇有感触地说:“计算机是个很特别的东西。算一个数,需要很多器件一起工作,若是在某个瞬间断一下,计算结果就会出大错。所以,工艺质量和设计质量一样至关重要。”

那段时间,除吃饭、睡觉和非参加不可的集体活动,金怡濂和同事们几乎所有的时间都泡在机房。除了研究设计,他们还花了大量时间,想了许多办法,排查机器的每一个工艺环节,以确保“一个焊点也不能出问题”。经过多轮调试,1959年国庆节期间,104机正式宣布完成,《人民日报》头版头条报道了这一喜讯。随后,它圆满完成了包括中国第一颗原子弹在内的许多重大课题的相关科学运算。

此时,金怡濂已离开104机研究小组,又陆续投入四台大型计算机的研制工作。金怡濂主攻的运算控制,被称为计算机的大脑和心脏。他提出了一系列可行性建议和改进方案,攻克了“穿通进位链加法器”等课题,逐步成长为中国大型计算机研制领域的骨干力量,被破格提拔为研究室副主任。

1969年,金怡濂作为主要技术负责人和总体组组长,主持国家重点工程九〇五乙机的研制。当时,国家的电子工业基础异常薄弱,金怡濂一方面与同事们下大力气帮助合作的元器件生产厂家提高质量,另一方面在国内首次提出“双机并行”的处理器系统结构,以双机并行提高机器的速度和稳定性,弥补元器件的可靠性不足。

双机并行,这在当时不少人看来是个极其大胆新颖的构想。但金怡濂说,这并非他异想天开,而是源自多年来坚持追踪国际新技术的心得。即使在鼓吹“知识无用”的年代,即使身在大西南信息闭塞的山区,他仍然想方设法获取最新的学术信息。每次到大城市开会或办事,他必定要去图书馆或资料室查阅学术资料。他说:“搞科研的人,不跟踪了解本专业的先进技术,无异于瞎子、聋子,长此以往,思维会迟钝,会失去想象力和创造力,失去创新的灵感和激情。”

由于地处偏僻,参考资料也极其匮乏。为查询资料,金怡濂要跑上海、北京等地。为此,得先在崎岖的山路坐大卡车颠簸半天,然后挤上火车,在硬座车厢里度过两三个昼夜的旅途。查完资料,匆匆背上一大包同事们让他捎带的肥皂、牙膏、糖果回到大山里,继续他的研制工作。由于国外对技术的封锁,大型计算机全靠我国自主设计生产,金怡濂主要负责硬件部分的设计把关,每一张图纸都自行设计绘制,生产一台机器需要绘制的图纸不下数万张,摞起来像个小山。尽管如此,凭着“革命加拼命”的精神,1976年,九〇五乙机宣布研制完成,运算速度达每秒350万次,开创了中国并行机研制的先河。

“科研条件固然重要,但起决定性的因素还是人。”金怡濂总结说。

花钱买不来高科技

1978年,中国迎来科学的春天。金怡濂代表九〇五乙机的全体参研人员、设计组和他个人,在第一次全国科学大会上捧回了三张奖状。两个月后,他又被派往美国和日本考察大型计算机。这次行程虽然收获不小,也让他们清醒地认识到了差距。

据金怡濂回忆,改革开放之初,国家百废待兴,急需更高性能的巨型计算机,迫不得已花巨资从国外进口了一台。然而,购机同时还须花钱“聘请”两位“洋监工”,由他们在控制室中监视机器的使用。双方签订的协议上还明确规定:中方人员不得进入控制室;开机、关机须由外方负责操作;中方不得将机器派作他用等等,这让金怡濂大感屈辱,他由此深刻地认识到,高科技是花钱买不到的,必须发展中国自己的巨型计算机,否则只能受制于人。

“核心技术是花钱买不来的。”感受到切肤之痛的金怡濂下定决心,一定要研制出属于中国人自己的、不输给任何人的高性能计算机。在中国科研人员废寝忘食的努力下,上世纪80年代,“银河”向量亿次机和九〇五工程亿次机两台运算速度达亿次级的巨型计算机相继成功研制。1991年,金怡濂所在的研究所又成功研制出速度达每秒10亿次级的中国第一台大规模并行处理计算机,逐渐缩小与美、日等国的差距。

那么,下一个目标,定在100亿,还是1000亿?各方争议不断。金怡濂是少数赞成直接研制1000亿次级巨型机的人之一。

他支持直接研制千亿次级绝非一时冲动,而是反复研究国外同行的成果近一年后得出的结论。“当我说出1000亿时,心中至少已有了七八成的把握,剩下两三成,也有一个初步判斷,预计那些问题可以解决。”

“计算机发展太快,早一年是先进的,晚一年就落后了。”他还有另一层考虑,直接挑战千亿次级,将是一次在该领域迎头赶上美、日等国的机遇,机不可失。

最终,新一代巨型机——“神威”的目标被确定为1000亿次级。当时已退居二线的金怡濂被邀请出山,担任总设计师。他提出以平面格栅网为基础的“分布共享存储器大规模并行结构”总体方案,同时提出网上多种集合操作以及无匹配高速信号传送等技术构想和解决方案,均获成功。这一成果实现了中国高性能计算机的历史性跨越。

1996年9月,“神威”研制完成。经测试,峰值运算速度达到每秒3120亿次,跨入国际领先行列。这意味着,仅用4年时间,中国高性能计算机的水平就提高了300多倍,远超“摩尔定律”每四年提升一个数量级的速度。

国庆五十周年展“神威”

1999年秋,无论是国家领导人,抑或是普通老百姓,谁不盼望新中国成立50周年大庆盛会这天的北京艳艳丽日、朗朗晴空?可是,“十一”前一天的下午,首都北京大雨倾盆,且一夜未停。亿万人都在关注天气预报,甚至有许多人在心中祈祷:“老天爷呀,‘十一露个笑脸吧!”

天公意愿谁先知?只有依靠“神威”。当时,“神威”的判断结论是:雨将在国庆早晨5时停,3个小时过后将云开雾散。在天安门广场盛况空前的国庆阅兵典礼现场,当太阳如期露出笑颜,受邀参加观礼的“神威”总设计师金怡濂也笑了……

国家气象中心利用“神威”计算机精确完成极为复杂的中尺度数值天气预报,在国庆50周年和澳门回归等重大活动的气象保障中发挥了关键作用。然而,金怡濂倾毕生精力为国家研制巨型计算机,并不仅仅是为了气象预报。他介绍,超级计算机通常是指当时性能最高、运算速度最快的一类计算机,是气象气候、石油物探、生命科学、航空航天、药物筛选和基础科学等领域不可缺少的高端计算工具,因此,中國未来的现代化建设不能没有巨型机。

此后,金怡濂带领他的团队再次向世界最先进水平发起冲击。这次,他们的目标更加明确——要在出机时达到世界第一。2001年底,“神威Ⅱ”研制完成,速度达到每秒13.1万亿次,其峰值速度和持续速度均超过了当时排名第一的高性能计算机;机器体积大为缩小,功耗也较低。因为对中国巨型计算机的发展做出重大贡献,金怡濂荣获2002年度国家最高科技奖。

当前,中国在高性能计算机领域已处于世界领先水平。2013年11月18日,国际TOP500组织公布最新全球超级计算机500强排行榜。中国的“天河二号”以峰值计算速度每秒5.49亿亿次、持续计算速度每秒3.39亿亿次双精度浮点运算的优异性能位居榜首。

金怡濂介绍说,目前,完全采用国产自主CPU设计的超级计算机“神威蓝光”速度已达到千万亿次级。但是,中国在基础研究、前瞻性研究、核心元器件及应用研究方面,与美、日等国相比,仍有相当差距。未来,预计到2020年前后,超级计算机的运算能力将突破每秒100亿亿次,全世界的同行都正在朝这个目标努力。

猜你喜欢
神威高性能研制
流翔高钙显神威 科学种植促增收
一款高性能BGO探测器的研发
高性能砼在桥梁中的应用
一种轻型手摇绞磨的研制及应用
接地线通用接地端的研制
SATA推出全新高性能喷枪SATAjet 5000 B
二代证高速电写入机的研制
高性能可变进气岐管降低二氧化碳排放
《神威启示录》系列报道三 神威现代中药研发的新思考
137Cs稳谱源的研制