十年磨一剑!Arm新一代Armv9架构解析

2021-08-14 16:21
新潮电子 2021年7期
关键词:指令集阵营合作伙伴

动互联时代,Arm总是显得格外活跃,除传统物联网设备外,当苹果Macbook Air搭载基于Arm设计的M1CPU亮相时,不少人意识到或许有必要重新认识一下这个控制全世界超1300亿个设备的处理器阵营了,而随着v9架构的出现,Arm及其阵营再次成为聚光灯下的焦点。

Arm时隔十年推出v9架构

2021年1季度末,英国芯片设计公司Arm正式宣布推出新一代芯片架构Arm v9,这是自十年前Arm v8推出以来,该架构的首次重大變革。新的v9架构两大重点是人工智能和安全,预计第一批搭载Armv9架构的处理器最快在今年年底前发货。

Arm首席执行官西蒙·塞加斯(Simon Segars)表示,v9架构将提高安全性和信任度,并为未来十年的计算机技术奠定基础。“当我们展望由人工智能定义的未来时,我们必须奠定一个领先的计算基础,为应对未来的独特挑战做好准备,Armv9就是答案。它将处于下一代3000亿颗基于Arm的芯片的最前沿,其驱动力是建立在通用计算的经济性、设计自由度和可获得性基础上的普遍的专业化、安全和强大的处理需求。”

据悉,Armv9有三大主要改进,即安全性更高,更好的AI性能,以及总体上速度更快。Arm表示,到2020年代中期,将有超过80亿台语音辅助设备,90%的应用将包含AI元素。Arm与富士通合作创建了可扩展矢量扩展(SVE),现在SVE2是Armv9的一部分,用于更好的机器学习和数字信号处理。

庞大的Arm生态

Armv9能够快速成为市场关注的焦点,很大程度上得益于Arm庞大的生态阵营影响力。

根据Arm最新统计数据显示,在2020年的最后一个季度,Arm的芯片合作伙伴共出货73亿颗Arm 架构芯片(年增22%),创下出货量历史新高,相当于每秒出货超过900颗芯片、每日出货7,000万颗芯片。Arm的合作伙伴在2020年总出货量高达250亿颗Arm架构的芯片(年增13%),累计总数已超过1,900亿。此外,Arm的GPU出货量累计超过80亿,其中在2020年GPU出货超过10亿,Arm Mali GPU持续位居全球GPU出货量榜首。

庞大出货量的背后是持续扩张的Arm生态阵营,在2020财年(2020年4月至2021年3月),Arm与104家客户签署了162个授权协议,其中有超过一半的授权对象为首次与Arm合作的企业。Arm近期合作的新客户还包括SEMIFIVE与Telechips。此外,Arm Flexible Access目前已有90家合作伙伴,通过该计划,这些合作伙伴可以更简易地获取各项全球领先的Arm IP、工具与支持。

在庞大的生态阵营支持下,Armv9架构必然能够快速落地,进而为数字生活时代带来一场全新的变革。

同步更新的Arm Mali GPU套件

视觉体验仍然是消费者与设备交互、并享用设备的关键,Arm推出面向最广泛应用的多款GPU,搭配全面计算解决方案中的Armv9CPU,提供卓越的用户体验。

Mali过去几年一直是出货量最大的GPU。新款Arm Mali-G710是针对旗舰智能手机和不断增长的Chromebook笔记本市场所推出的高性能GPU,在计算密集型体验方面(如AAA高保真游戏)的性能提升20%。对于各种与机器学习有关的任务(如全新相机和视频模式的图像增强),Mali-G710也带来了35%的机器学习性能提升。

Arm的互连技术对于提高系统性能至关重要。最新的CoreLink CI-700一致性互连技术和CoreLink NI-700片上网络互连技术与Arm CPU、GPU和NPU IP无缝搭配,可跨SoC 解决方案增强系统性能。CoreLink CI-700和CoreLink NI-700对新的Armv9-A功能提供硬件级支持,如内存标签扩展(Memory Tagging Extension)等等。

下一代处理器性能大提升

从2011年11月发布ARMv8开始,ARMv8已经走过将近10年时间。ARMv8架构的主要特点是增加对64位指令集的支持,包括目前性能最强的Cortex-X1/A78,都是基于ARMv8.x指令集打造。ARM在2021年3月31日正式推出ARMv9指令集,在兼容ARMv8的基础上,提升处理器性能,同时提升安全性、增强矢量计算、机器学习及数字信号处理。

在人们最为关注的性能方面,下一代的Matterhorn架构及Makalu架构会保持30%以上的IPC性能提升,加上未来更先进工艺带来的频率提升,最终CPU性能提升有望达到40%。

以智能手机等移动平台使用的Cortex-X/A系列为例,X1/A78的性能比16nm Cortex-A72提升2.5倍。ARMv9同时还将内存延迟从150ns降至90ns、频率从2.6GHz到33GHz、内存带宽从20GB/s提升至60GB/s、并加快缓存的存储速度等。

ARMv9与性能有关的重要升级就是SVE2指令集,SVE最早是ARM与富士通合作的浮点性能扩展,TOP500超算富岳就使用SVE指令集SVE2就是第二代SVE浮点指令。与SVE的128位矢量相比,SVE2可以支持128为倍数、最多2048位运算。

因此SVE2可以增强ML机器学习、DSP信号处理能力,提升未来5G、虚拟现实、增强现实以及CPU本地运行ML的性能,同时ARM未来还会继续提升AI人工智能性能。ARMv9第三大升级就在于数据安全,全新的CCA机密计算体系架构基于TrustZone安全技术,并引入动态域技术。

未来3000亿ARM芯片的基础

ARM官方称是10年来最重要的创新,是未来3000亿ARM芯片的基础。

与上一代的ARMv8相比ARMv9处理器将不再局限于移动/嵌入式市场,现已经扩展到PC、HPC高性能计算、深度学习等新市场,以满足全球对功能日益强大的安全、人工智能(AI)和无处不在的专用处理的需求。

Amv9架构有两个核心侧重点:人工智能和安全。ARM表示到21世纪中叶,将会有超过80亿台语音辅助设备,90%的应用将包含AI元素。在安全方面,Armv9会获得Arm Confidential Compute Architecture(CCA),在使用时屏蔽数据的访问,在硬件层面保护数据。此外,还会有一个叫做Realms的东西,应用程序可以在安全和非安全区域之外使用。

悄然改变的人类生活应用场景

科技正在医疗保健、环境可持续发展与生产力提升中扮演越来越重要的角色,Arm的技术也正被采用在各种多元的应用中,给全世界带来积极的影响。最近的实例包括:

·Arm与Neocortix公司合作提供Arm 64位计算的支持,促成了Folding@home与Rosetta@home两个项目,项目利用数十亿颗Arm架构设备的闲置计算容量,协助医学研究人员对抗新冠肺炎病毒。

·Arm的伙伴Hypergiant公司致力于探索AI技术的使用,改善可从大气中移除二氧化碳的藻类生物反应器(该Eos生物反应器由Arm CPU所赋能)。

·在印度尼西亚的一个项目中,Rainforest Connection组织与保育人士合作,部署基于Arm CPU与GPU技术的设备,监听所在地每一处重型机器与电锯的声音,以打击非法盗伐。

随着Armv9架构的落地以及5G、AI等前沿新兴技术的融合突破,相信会有越来越多的人类生活应用场景在潜移默化中逐渐改变的。

Arm阵营CPU架构也进入64位时代

ARM日前明确表示了这代指令集升级64位的决心,官方声明中指出2023年ARM所有的大小核架构都将采用64位,32位指令届时会被淘汰。至于之前担心放弃32位会导致兼容之类的问题,ARM认为64位已经是成熟的技术,进入纯64位时代没问题。

在手机处理器中,苹果2013年发布的iPhone 5s是首个支持64位的,A7处理器首发ARM 64位架构,之后高通在骁龙810上也支持64位了,安卓5.0之后谷歌也原生支持了64位ARM处理器了。

国内市场,今年4月份小米应用商店、OPPO软件商店、vivo应用商店、腾讯应用宝、百度手机助手宣布,今后发布于各应用商店的所有应用必须有序支持64位Arm架构,今年底前全体应用及游戏均需按计划上传含有64位构建的APK(涵盖存量应用更新及新版本发布)。按照时间表,中国市场所有的移动安卓应用程序定于2022年8月底前全面普及64位。

快速跟进的合作伙伴

面对未来可期的Armv9,Arm各合作伙伴也是相当的积极地跟进。在5月31日的台北电脑展上-ARM CEO Simon Segars公开透露,联发科是Arm的长期合作伙伴,每年出货数亿颗Arm芯片,年底前也将推出首款基于Armv9架构的新品。联发科则表示Armv9会给下一代天玑5G产品赋予新的能力,带来更好的体验。

此外,有业内人士爆料称高通正在开发一款代号为SM8450'Waipio的芯片,将作为骁龙888(SM8350)的继任者,同样会基于Armv9架构以及4nm工艺。

随着上游芯片的出现,相信搭载Armv9架构的终端产品也会快速进入市场。

盯上数据中心市场的Arm阵营

以往Intel和AMD两大阵营在数据中心市场拥有绝对的话语权,而今天,虽然两家依旧强大,但Arm阵营却依托Armv9架构开始攻城略地。Arm公布了Ne。verse V1和N2服务器芯片平台的最新性能数据,其处理能力比上一代N1提高了40%~50%。Neoverse V1平台首次支持可伸缩矢量扩展(SVE,N2平台则率先采用全新Armv9架构的平台,拥有比N1更高的核心数、性能和能效。尽管Arm并未直接对比Neoverse平台与英特尔、AMD产品的性能,但从图中可以看到,Neoverse系列芯片已经非常有竞争力。

基于Neoverse平台的新功能,Arm合作伙伴及客户能更加顺利地实现从云端到边缘的部署。在云服务方面,腾讯与Arm持续合作,腾讯在硬件测试和软件支持方面持续投入,使其在云应用上能采用Arm Neoverse技术,每瓦性能表现出色,软件部分既支持已编译和解译的代码库,也支持为这些代码库提供支撑的微服务框架。

阿里云在即将上线的基于Arm架构ECS实例上完成了测试,并在SPECjbb测试数据中表现出色,通过双方紧密合作,基于Arm架构运行的DragonWell JDK性能提高了50%。用户及开发者现可到阿里云网站上注册,获取Arm系列实例的受邀测试。

除了在主流应用用例中,Graviton2和Neoverse也被应用于更多专用处理的应用场景。例如在EDA方面,Arm获得了所有主要工具供应商的支持,并且详细计划了Arm如何将EDA的工作负载移上云端。对于目前运行的各种工作负载和应用程序,Arm正尝试推出能兼顧高算力和低功耗的计算解决方案,这对于主导x86架构的服务器处理器供应商英特尔和AMD无疑正造成新的冲击。

写在最后:

在公开场合中,Arm高级副总裁兼终端设备事业部总经理Paul Williamson表示“我们正致力于将Armv9技术引入到各个领域,以系统级设计最大限度地提高性能。安全的专用处理能力所具备的诸多优势,意味着基于Arm架构的计算技术正在构建超越智能手机市场以外的领导地位,借助移动生态系统带来的巨大规模优势,在笔记本电脑、台式机、云等应用领域打造领先的解决方案。”Arm全新的全面计算解决方案采用系统范围的整体优化方法,横跨硬件中、物理IP、软件、工具和标准。

全面计算解决方案也将解锁整个生态系统的新体验,例如,专为移动设备设计、支持AI功能的交互式应用场景,可以使用户身临其境观看电视中丰富的8K内容。所有的这一切再加上安全技术作为基础,将为未来十年构建可信的数字化服务。

猜你喜欢
指令集阵营合作伙伴
分不开的合作伙伴
透过实质行动支持盘臂头阵营 Naim Audio推出NAIT XS 3/SUPERNAIT 3合并功放
3DNow指令集被Linux淘汰
聚焦IBIS全球合作伙伴——Carstar及Mitchell公司
美印合作伙伴
CHIP全球合作伙伴
实时微测量系统指令集及解析算法
顺丰联手“三通一达”反水对抗阿里菜鸟阵营
什么是AMD64
基于覆盖率驱动的高性能DSP指令集验证方法