2023年中国高性能计算机发展现状分析与展望

2023-12-24 10:34张云泉袁良袁国兴李希代
数据与计算发展前沿 2023年6期
关键词:超级计算机算力排行榜

张云泉,袁良*,袁国兴,李希代

1.中国科学院计算技术研究所,北京 100190

2.北京应用物理与计算数学研究所,北京 100088

背 景

自1993年起,国际上每半年会按Linpack的测试性能公布在世界范围内已安装的前500 台高性能计算机排行[1-2]。我国自2002年起每年会公布安装在中国大陆的国内高性能计算机性能TOP 100 排行榜。这些排行榜成为分析和预测高性能计算机体系结构演化、应用领域兴替、研制厂商竞争、超算行业发展的重要参考。

首先,从TOP 100榜单冠军来看,2002-2004年我国高性能计算机排行榜中名列第一的联想深腾1800 万亿次机群、联想深腾6800 万亿次机群和曙光4000A 分别在当年的世界TOP 500 排行榜中位列第43、14 和10 名;2005-2007 年由IBM研制的两台机器获得我国高性能计算机排行榜冠军;2008 年TOP 100 排行榜冠军曙光5000A 超算系统再次跻身当年TOP 500 排行榜第10 名位置;2009 年由国防科大研制的天河一号获得TOP 500排行榜第5名。

2010-2012 年占据中国TOP 100 排行榜第一位的是由国防科大研制的CPU+GPU 异构系统国产天河一号A 千万亿次超级计算机,也在2010 年11 月国际TOP 500 排行榜中夺得冠军;2013-2015年同样由国防科大研制的CPU+MIC异构系统天河二号超级计算机,连续3年获得中国TOP 100 和国际TOP 500(六届)排行榜冠军。至此,国防科大研制的天河系列超级计算机7次夺取世界第一。

2016 年,由国家并行计算机工程技术研究中心研制的神威·太湖之光基于国产SW26010众核处理器和互联网络,替代天河二号系统获得两个排行榜第1名,并连续5年夺得中国TOP 100榜首,连续2 年(四届)获得国际TOP 500 冠军。2021 年,由服务器供应商研制的网络公司主机系统,采用CPU+GPU 异构众核处理器架构,以125 PFlops 的Linpack 性能位居中国TOP 100 榜首。2022 年,服务器供应商采用相似架构研制成功一台Linpack性能超过200 PFlops的网络主机系统;2023年,服务器供应商采用异构众核架构研制成功一台Linpack性能达487 PFlops的超算中心主机系统。超级计算系统作为计算科学的必备基础设施,已经成为国家之间的战略必争点和创新转型的利器,各国都投入巨资争夺世界制高点,以超级计算机系统为核心的算力经济时代已经到来。经过30 年的快速发展,中国研制超算系统的能力以及研发具有超大规模可扩展性并行应用的水平已经跻身世界先进行列。

其次,从超级计算机系统份额看,2010年我国安装的超级计算机的上榜数量首次超越日本和欧盟,排名世界第二,仅次于美国;2016 年TOP 500 中安装在中国大陆的超算系统首次超过美国,排名世界第一,联想制造的超算系统上榜数位列美国HPE 之后排名第二;2018 年11 月公布的TOP 500榜单中,我国以227台数量远超第二名美国的109台,其中联想制造的超算系统达到140 台,位列厂商第一,浪潮和曙光分别以84台和57台位列二、三名,三家厂商占据281台超过一半,出口54台。2019年11月公布的TOP 500 排行榜中,我国228 台数量远超第二名美国的117 台,其中联想达到174 台,曙光和浪潮以71 和66 台继续位居二、三位,三家单位合计311台。2020 年11 月公布的TOP 500 排行榜中,我国继续以213 台数量远超第二名美国的113 台,其中联想达到181 台,继续保持增长态势,浪潮和曙光以66 和51 台位居二、三位,三家单位合计298台。2021年11月的TOP 500排行榜中,我国继续以173 台系统排名第一,美国以143 台紧随其后。2022 年11 月的TOP 500 排行榜中,我国继续以162 台系统排名第一,美国以127 台排名第二。2023 年11 月的TOP 500 排行榜中,我国超算系统数量为104 台,美国为161 台,联想仍旧以169台数量排TOP 500制造商第1名。美国虽然仍是世界超算的强国,但是其在TOP 500上的数量已经降低到不足40%的份额,难以恢复20年前独霸世界TOP 500 70%系统的盛况。

在超算应用方面,我国分别在2016、2017和2021年SC大会上获得3次国际上高性能计算应用领域的最高学术奖——戈登贝尔奖。2016和2017 年获奖的“千万核可扩展全球大气动力学全隐式模拟”和“非线性大地震模拟”均为基于神威·太湖之光系统的全机应用;2021 年的“超大规模量子随机电路实时模拟”基于一台神威新系统对量子进行了开创性的电路模拟。同时,2014、2016、2017、2018、2021、2022 和2023年各有1项、2项、1项、1项、2项、1项和1项工作获得戈登贝尔奖提名。此外,2015 年清华大学团队获得了三大国际大学生超算竞赛——SC超算大赛、ASC 超算竞赛和ISC 超算竞赛冠军,成为全球第一支获得三大超算赛事大满贯的团队;2016年在SC 16大会上举办的大学生超算竞赛中,中国科学技术大学代表队包揽了总分和最高LINPACK 性能两项冠军,成为SC 大学生超算竞赛自2007 年举办10 年以来首个双料冠军队;2021 年在SC 21 总决赛上,清华大学超算团队再次夺得总冠军,实现SC 竞赛四连冠。这些大规模应用软件可扩展性和性能调优方面的成绩表明我国在并行软件方面的发展方兴未艾。

本文基于中国计算机学会高性能计算专业委员会与中国工业与应用数学学会高性能计算与数学软件专业委员会于2023 年11 月发布的中国高性能计算机性能TOP 100排行榜[3]数据进行深入分析与展望。文中的图表数据主要来源于中国HPC TOP 100。以下将中国HPC TOP 100简称中国TOP 100[4-11]。

1 总体性能分析

本节图1和表1分别给出的是中国TOP 100的总体性能发展趋势图以及TOP 10计算机情况的列表。与2023年11月发布的世界TOP 500高性能计算机的情况相比较,可以看到:

图1 中国高性能计算机年度性能发展趋势(2002-2023)Fig.1 The performance trend of HPC TOP 100(2002-2023)

表1 中国TOP100排行榜TOP10(2023.11)Table 1 The Top 10 systems(2023.11)

(1)2023年11月世界TOP 500总Linpack性能达到了7,032 PFlops,是2022 年4,864 PFlops的1.45 倍,增速与去年的1.47 倍基本持平;根据2023年中国TOP 100排行榜的数据,中国TOP 100的 总Linpack 性能是1,398 PFlops,是2023 年899.9 PFlops 的1.55 倍,增速与去年的1.30 倍相比有较大幅度增长,但与前年的1.79 倍相比仍有提升空间,这说明中国超级计算的发展速度有较快恢复和增长能力。

2023年,由服务器供应商研制、部署在超算中心的异构众核处理器主机系统位居榜首,它是当前中国最高性能的计算机系统,系统包括15,974,400 CPU 核,系统峰值为620 Pflops,Linpack 性能为487.940 PFlops,是排名第二机器208.260 PFlops的2.34倍和排名第三机器的Linpack测试值的3.90倍。

由服务器供应商研制、部署于网络公司的CPU+GPU异构众核主机系统降为第二名,包括460,000 CPU 核,系统峰值为390 PFLOPS,Linpack 性能为208.260 PFlops,应用领域为算力服务,是排名第三机器125.040 PFlops 的1.66 倍和第四名神威·太湖之光系统Linpack 测试值的2.24倍。

中国研制的神威·太湖之光超级计算机,以93.015 PFlops的Linpack性能排在TOP 100第四名。太湖之光曾蝉联了4次世界TOP 500冠军,使得中国研制的国产超级计算机在世界TOP 500的冠军位置上保持的次数达到了历史性的11次!2023 年美国制造的Frontier 超算系统继续排在TOP 500榜首,峰值和Linpack性能双双突破1 EFlops,分别为1.685 EFlops 和1.102 EFlops。2023年11月TOP 500中排在亚军和季军的为两台新增机器。部署在美国阿岗国家实验室的Aurora 以585.34 PFlops 的Linapck 性能排在第二,其峰值为1.059 EFlops,是第二台峰值超过1 EFlops 的机器,Aurora 仍然在扩展中,预计完成时峰值性能超过2 EFlops,值得注意的是Aurora 配置了Intel Data Center GPU。排名第三的机器为微软的云计算服务器Eagle,其Linpack性能为561.2 PFlops,峰值为846.8 PFlops,处理器为Intel Xeon Platinum 8480C 和Nvidia H100。2020年日本制造的、峰值首次突破500 PFlops的Fugaku超算系统排名第四,其Linpack性能达到442.010 PFlops。由HPE Cray研制的另一台LUMI 排名第五,其架构与排名第一的Frontier完全一致,峰值和Linpack性能分别为428.703 PFlops和309.100 PFlops,另一台2022年由Atos研制的Leonardo 超算系统以174.700 PFlops 的Linpack性能排名第六,2018 年美国制造的两台超算系统Summit 和Sierra 排在第七和第十,其中Summit 峰值达到200 PFlops,Linpack 性能为历史首次突破百P达到148.600 PFlops,Sierra仅以微弱优势超越神威·太湖之光,神威·太湖之光位居第十一名。

(2)进入2023年11月份,世界TOP 500机器的Linpack 性能都超过了2.015 PFlops;进入2023 年,中国TOP 100 机器的Linpack 性能都超过了2.026 PFlops,中国排行榜的上榜门槛再次超过世界TOP 500,不过性能的差距在逐步缩小。中国TOP 100 中有98 个系统是机群,机群体系架构的数量继续保持绝对数量优势。其中采用异构加速体系架构的机器数量达到了30套,且由过去的集中在前几名和比较大的机器,变为分散在TOP 100中,这样的变化表明随着深度学习等大数据应用的普及,GPU 加速的异构体系结构获得了更广泛的应用。

(3)世界TOP 500 中TOP 10 中前九名性能都超过120 PFlops;其中HPE制造2台,EVIDEN制造2 台,Intel、IBM、Microsoft、日本富士通公司、Nvidia各1台。高端能力型超算(TOP 10)的研制呈现出几家独大的局面,中美日欧都在积极占领制高点,特别是2022年发布的Frontier达到Linpack 实测性能超过1 EFlops,在TOP 10 机器占比和性能占比上已经超过中国。中国TOP 100 中,TOP 10 的最低性能大于10 PFlops,其中服务器供应商7 台,北龙超云、国家并行计算机工程中心和国防科大各1台。

(4)世界TOP 500上采用Intel处理器的超算系统达到338 台,379 台,虽然依然保持较高占比,但较之前3 年的379 台、408 台和前年的459台相比,占比继续下降,而采用AMD 处理器的超算系统达到139 台,较之去年的101 台占比继续增加,其中EYPC系列CPU的137台,Rome处理器2台。IBM处理器和富士通处理器分别有7和8 台系统。这表明了以AMD 和IBM 为代表的处理器制造商对Intel的激烈竞争。

采用异构加速体系架构的系统数量再次上升,从2020 年的148 套、2021 年的150 套、2022年的178 套到2023 年的186 套。中国TOP 100的趋势与TOP 500 类似,2023 年有30 套系统采用了GPU/MIC加速,虽然与2022年的33套相比有所减少,但在前十名中的占比依然较高,其中主要归因于深度学习算法在互联网公司的成功应用,使得CPU+GPU的异构加速集群成为当前互联网公司进行AI训练的首选体系架构。

(5)亚洲国家在世界TOP 500上的机器数量从2020 年的267 台、2021 年的226 台、2022 年的218台到2023年的169台,虽然继续保持较高占比,但每年呈下降幅度。排行榜中有来自中国大陆的104 套,相比去年的162 套和前年的173套系统继续下降,美国上榜机器数量达到163套总数超过中国排世界第一。虽然中国上榜的数量排名世界第一,但应该清醒地认识到,其中大部分的机器并非应用在传统的科学计算应用,而是新兴的互联网云计算和大数据应用。

(6)2023年中国TOP 100排行榜中机器的平均Linpack 性 能13.983PFlops 是2021 年8.999 PFlops 的1.55 倍。2023 年国际TOP 500 排行榜中机器的平均Linpack 性能为14.075 PFlops,是2021 年9.728 PFlops 的1.44 倍,增 速较去年 的1.60倍有所降低,主要原因在于排名第一的机器对平均性能的影响很大。国内和国际排行榜的平均性能双双首次超过10 PFlops。

2 制造商分析

图2 中给出了中国TOP 100 制造商的上榜机器数量份额图。

图2 中国TOP100制造商机器数量份额图(2023.11)Fig.2 Vendors system share(2023.11)

2023 年中国TOP 100 排行榜上厂商的上榜机器数量份额与去年类似,国产机器的市场份额主要被联想、浪潮和曙光三家瓜分,联想今年以43台机器获得份额第一名,浪潮以24台位列第二,曙光10台获得第三。

图3给出的是从2002年到2023年中国TOP100国内外厂商系统份额的趋势变化情况。

图3 中国TOP100国内外厂商系统份额趋势(2002-2023)Fig.3 Trend of the vendors system share(2002-2023)

从装机数量上,前三名分别是联想(43%)、浪潮(24%)和曙光(10%)。北龙超云公司作为HPC 研制厂商出现在2021 年的TOP 100 上,并继续占据5%的份额,其中3套系统占据了第10、13 和14 名的位置。联想、浪潮和曙光公司虽夺得机器总数量的前三名,且总数量占比达77台,但其机器总性能之和占比较小,说明其机器规模仍然属于中小规模。联想公司通过对IBM公司X86 HPC 产品线的并购,第10 次在机器数量份额上取得冠军,但是如何保持良好的发展势头并持续大力投入,是联想公司需要解决的问题。目前的中国超算市场由原来的联想、浪潮和曙光三足鼎立的格局逐步变为了联想和浪潮间的相互竞争。2011 年,国外厂商在HPC 领域又通过联合北龙超云共同研制而返回中国市场,未来如何发展值得关注。国产厂商在逐渐获得国内市场的垄断优势之后,开始纷纷布局国际市场,开启国际化的征程,其中的华为和联想公司,因为本身公司已经是跨国公司,具备先发优势。而浪潮公司和曙光公司在国际市场有所斩获,传出好消息。

2023 年11 月的TOP 500 排行榜中,我国上榜机器为104 台,美国以163 台近年来首次超越我国。联想制造的超算系统达到168台,位列厂商第一,浪潮和曙光分别是35 台和9 台,3 家厂商占据212 台,与去年的244 相比继续下降,这充分说明了我国超算发展已经牢牢占据领先地位,超级计算系统会成为中国继高铁之后,另外一个可以出口的中国制造高科技产品。

3 行业领域分析

为便于分析,我们在图4 给出了2023 年中国TOP 100 中的行业应用领域Linpack 性能份额图。

图4 中国TOP100行业应用领域机器Linpack份额图(2023.11)Fig.4 Application field Linpack performance share(2023.11)

从2023年11月发布的中国TOP 100的行业应用领域来看,去年新增的算力服务这一类型的占比继续增加,由2011 年的46%、2022 年的56%到今年的72%,充分反映了算力经济时代的到来。算力将具体的计算软件和硬件统一地抽象为执行计算的能力。算力服务即提供算力的一种模式,是包括算力生产者、算力调度者、算力服务商以及算力消费者在内的算力产业链上算力经济模式的统称。

本文作者张云泉在2018年就提出算力经济概念[12-14],指出以超级计算为核心的算力经济将成为衡量一个地方数字经济发展程度的代表性指标和新旧动能转换的主要手段[15-17]。综合近几年的发展趋势[18-20],本文认为高性能计算当前发展趋势已充分表明,随着超算与云计算、大数据、AI的融合创新,算力是当前整个数字信息社会发展的关键,算力经济已经登上历史舞台。

从Linpack 性能份额看,算力服务以72%的比例占据第一,超算中心占12%排名第二,大数据、科学计算和云计算分别以4%、4%和2%紧随其后。人工智能占比的持续增加与机器学习等算法和应用的快速崛起,以及大数据中的深度学习算法的广泛应用有很大关系,互联网公司通过深度学习算法重新发现了超级计算机特别是GPU 加速的异构超级计算机的价值,纷纷投入巨资建设新系统。

综合来看,目前的算力服务、超算中心、人工智能、科学计算等领域是高性能计算的主要用户。互联网大数据特别是AI领域增长强劲。

根据历年积累的数据,图5给出了中国TOP 100从2002年到2023年的应用领域趋势图。

图5 中国TOP100应用领域趋势(2002-2023)Fig.5 Trend of application field system share(2002-2023)

4 总结与展望

综上,2023年中国TOP 100排行榜的主要亮点如下:

(1)由服务器供应商研制、部署在超算中心的异构众核处理器主机系统位居榜首,Linpack性能为487.940 PFlops。

(2)联想位列中国TOP 100数量份额第一名;

(3)TOP 100 总体性能为1,398 PFlops,中国高性能计算市场的增速有所恢复;

(4)入门系统性能门槛继续提升,达到2,026 TFlops,再次超过国际TOP 500 的入门系统性能2,015 TFlops;

(5)98套系统采用机群结构,计算机体系结构创新形势依然严峻;

(6)上榜高性能计算机制造商为9 家,国产率95%,市场份额集中在联想、浪潮和曙光三家厂商,占据77%的数量份额;

(7)算力服务应用领域继续增长,充分反映了在大数据、人工智能算法和算力三驾马车协同配合时代中算力经济的发展。

利益冲突声明

所有作者声明不存在利益冲突关系。

猜你喜欢
超级计算机算力排行榜
基于网络5.0的重叠网形态算力网络
卫星通信在算力网络中的应用研究
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
超级计算机
基于SiteAI算力终端的交通态势感知系统
超级计算机及其在航空航天领域中的应用
排行榜
美国制造出全球最快超级计算机
排行榜
每秒100亿亿次 中国超级计算机