首颗5nmSoC君临

2020-12-22 07:44
电脑爱好者 2020年24期
关键词:达芬奇麒麟载波

5nm成就153亿晶体管

我们都知道,制程工艺越先进,可以在相同尺寸和封装面积的芯片内塞进越多的晶体管,实现性能和功能的进一步提升。麒麟9 0 0 0系列最大的特色,就是采用台积电最新的5nm(EUV)工艺,集成了高达153亿个晶体管(图1),较之同样采用5nm工艺打造的苹果A14(118亿)增加了30%左右。由于麒麟9 0 0 0还同时集成巴龙50 0 0基带单元,所以它便成為了全球第一颗基于5nm工艺制造的5G SoC。

混搭的CPU和GPU核心

麒麟9000系列包含麒麟9000标准版和麒麟9000E,二者的差异在于GPU和NPU的核心规模(图2),笔者将它们与其他麒麟9系5G SoC的规格进行了对比(表1)。

简单来说,麒麟9000系列是一颗“新旧搭配”的SoC,它的CPU部分选用了ARM在2019年发布的Cortex-A77老架构,而GPU部分则是ARM在2020年最新推出的Mali-G78,从理论层面的竞争底蕴来看并不如Cortex-X1+Cortex-A78+Mali-G78这种新新组合。

但是,麒麟9000系列却深谙“一力降十会”的道理。根据ARM的官方数据,Cortex-A78相较于Cortex-A77,其IPC(同频率下的架构性能)只提升了7%,功耗降低了4%,差距其实并不明显(图3)。此次,麒麟9000系列将最高主频直接拉到了3.13GHz,打破了智能手机芯片史上的最高频率记录,用以迎接Cortex-A78乃至Cortex-X1的挑战。考虑到高频带来的高功耗,麒麟9000系列改用了1+3+4的三丛集方案,即只有1个大核心能达到3.13GHz,而其余3个Cortex-A77则只能运行在2.54GHz的主流频率上。

再来看看麒麟9000系列的GPU,它所集成的Mali-G78沿用了Mali-G77采用的Valhall图形架构,但通过对全局时钟域的优化和重写的FMA(融合乘加)引擎,较之Mali-G77的性能提升幅度高达25%,即便是在同等工艺条件下也可提升15%,同时能效提升10%,机器学习性能提升15%(图4)。

Mali-G78GPU最多可以搭配24个计算单元(图5),没错,麒麟9000集成的Mali-G78MC24就是这颗GPU的“满血版”(指核心数量,不涉及核心频率),而麒麟9000E也集成了多达22个计算单元的Mali-G78MC22。作为对比,Mali-G77最多可以搭配16个计算单元,但受制于成本、发热和功耗,哪怕是最激进的三星Exynos990也才用了11个。Mali-G76最多可以搭配20个计算单元,但麒麟990系列也只用了16个。

换句话说,麒麟9000系列集成的Mali-G78MC22或Mali-G78MC24,已然代表了这颗GPU的性能上限。

基于AI的一系列革新

麒麟970和麒麟980集成的NPU来自寒武纪,从麒麟810和麒麟990开始,则改用海思自研的达芬奇架构1.0。麒麟9000的另一个特色,就是将集成的NPU升级到了达芬奇架构2.0(图6),后者通过架构升级和指令增强,以及华为SmartCache2.0技术的加持,AI计算带宽最高提升了100%,能效最高提升15%,性能最高提升20%。以智能识别2000张照片的速度为例,3年前的麒麟970需要60秒,而麒麟9000则只需1秒。

如果说过去的NPU算力只能处理静态图片,麒麟9000系列集成的NPU(大核部分)则已经可以处理动态的视频了(图7),比如将一段视频中的人物秒变卡通风格,再比如通过AI对视频进行去噪、锐化、超分和色彩增强等,将标清视频提升到接近超清画质,让高清视频秒变接近蓝光画质。当然,上述功能还需要APP端的支持,华为现在正与视频播放平台进行合作,未来可期。

麒麟9000系列集成的NPU微核主要赋能智能感知,它可以全天候以超低功耗运行,用于实现AI隔空手势、AI灵动熄屏等交互功能(图8)。

除了达芬奇架构2.0的NPU,麒麟9000系列此次还集成了ISP6.0单元,并实现了ISP+NPU的融合架构,具备实时包围曝光HDR视频合成能力、超强细节还原及降噪算法、能够更清晰地处理视频图像,逆光拍摄的画质也更趋完美(图9)。此外,麒麟9000系列支持AI+AR智能环境感知功能(KirinAR3.0),可以让手机看懂形状,测量尺寸,识别种类,计算数据、位置等,无论是针对人脸还是周围环境都能够识别建模,实现强大的实时感知能力(图10)。

载波聚合让5G速率翻番

麒麟9905G虽然是量产最早的5GSoC,但由于它不支持载波聚合技术,下行和上行速率分别只有2.3Gbps和1.2Gbps。作为对比,天玑1000系列的下/上行速率分别为4.7Gbps和2.5Gbps,而驍龙865更是高达7.5Gbps和3Gbps。需要注意的是,骁龙865的高速率是建立在毫米波频段下的峰值速度,在Sub-6G频段中的速率将大打折扣。

麒麟9000系列虽然依旧集成巴龙5000基带,但加入了对5G双载波聚合技术的支持,可以将2个100MHz的载波进行聚合,从而实现对于200MHz带宽的利用。在Sub-6G频段中的下/上行理论峰值速率提升到了4.6Gbps和2.5Gbps(图11),追平了其他5GSoC玩家。此外,麒麟9000系列还搭配支持Wi-Fi6+的麒麟W650单元,理论峰值速率可达2.4Gbps。

麒麟9000实测性能分析

得益于5nm工艺,超过3.1GHz的大核主频以及满血Mali-G78MC24GPU的加持,麒麟9000在常见理论跑分软件中的测试成绩并没有让我们失望(表2)。它不仅具备秒杀前辈麒麟9905G的实力,在与搭载骁龙865的iQOO5Pro(几乎是同配置手机中的最强音)的较量中也能全面领先,一改麒麟3D性能总是落后同期骁龙的历史。

需要注意的是,表2中的跑分都是Mate40Pro在“性能模式”下测得,该模式虽然可以“满血输出”,但存在较高的发热量,不适合长时间运行《原神》一类的高负载游戏,否则容易出现过热降频现象。实际上,Mate40Pro在平衡模式下的性能输出就已经不逊于骁龙865了,可以兼顾性能、功耗和温度。当然,如果你给手机配备了外部散热器,再激活性能模式就无须担心过热风险,只是电量的消耗会更快一些。

麒麟9000的对手即将来袭

继麒麟9000之后,5nmSoC领域还将先后迎来三星Exynos1080、Exynos2100、高通骁龙875和天玑2000(表3)。这些竞品的特色在于全部采用了ARM最新的Cortex-A78架构,除了Exynos1080以外还都引入了Cortex-X1超大核,在能耗比方面的表现上可能将优于麒麟9000。如果你对这些芯片的具体规格和性能感兴趣,敬请关注CFan的后续报道。

猜你喜欢
达芬奇麒麟载波
麒麟“破冰”
轻松做完大手术——聊聊达芬奇手术机器人
对麒麟
它就是麒麟
达芬奇想飞
手术室的“阿尔法狗”:达芬奇机器人
应急广播系统中副载波的构建与应用
低压载波通讯测试仪的开发与应用
基于最优化搜索的迭代载波同步算法
一种双频载波相位周跳探测与修复的方法