浅析英特尔锐炬Xe Max独显

2020-12-22 07:44

电脑爱好者 2020年24期

22年后再战独显

1998年，英特尔曾经推出过自主品牌的独立显卡——Intel i740（图1），这颗芯片是英特尔以购买Real3D公司20%股权为代价，与其携手合作定制的产品，从而以较小的代价迅速进入了3D图形市场，与同期的3dfx、ATI、NVIDIA、S3、Trident和Matrox竞争。随后，i740还被英特尔整合进了810/815芯片组（改名为i752），构筑了其一统“集显江湖”的基石。可惜，Real3D公司在1999年时倒闭，英特尔的独显品牌之路也戛然而止。

继i740之后，英特尔其实并没有放弃独显产品的规划，曾计划在2010年推出代号为““Larrabee”的独显品牌（图2）。Larrabee号称是第一款实用级万亿次运算图形处理器，其最大特色是在GPU内引入X86指令，从而使得编程更加简单，同CPU之间的数据交换可以保持一致性，大大降低图形应用程序的开发周期和难度。可惜，Larrabee“出师未捷身先死”，由于其性能以及驱动的开发远远落后于原先的计划，最终沦落成为Xeon Phi加速器的项目。

在过去的20余年中，英特尔核显品牌历经了多次迭代，比如去年第10代酷睿IceLake集成的核显就隶属于Gen11，而今年第11代酷睿TigerLake集成的核顯则是Gen12。只是，英特尔对Gen12寄予厚望，后者改用了全新可扩展的向量-矩阵架构，高度可扩展性让它能够针对不同市场推出不同分支的架构和产品，从面向高性能计算市场Xe-HPC，面向数据中心/AI计算的Xe-HP，再到面向游戏玩家的Xe-HPG以及面向移动端的Xe-LP（图3）。

没错，第11代酷睿处理器集成的锐炬Xe（Iris Xe）就是基于Xe LP超低功耗架构打造，而我们今天文章的主角，锐炬Xe Max同样是源于Xe LP定制。从本质上来看，它们其实就是同一颗芯片，可以简单理解为拥有独立显存的锐炬Xe核显超频版。

锐炬Xe Max独显解析

根据英特尔的规划，锐炬XeMax将细分为移动版和桌面版，它们的品牌名称和Logo相同（图4），第一批上市的则是用于轻薄本市场的移动版。我们不妨先将英特尔常见的Gen11/Gen12核显与锐炬XeMax独显进行一下对比，寻找它们的共性与差异（表1）。

存在形式的差异

虽然锐炬Xe和锐炬XeMax都是基于Xe-LP架构设计，但它们核显和独显身份，注定了二者在存在形式上有着本质上的差异。其中，锐炬Xe核显被直接整合进了第11代酷睿处理器基板上的芯片中（图5），通过Ringbus总线与CPU内核连接，并将部分内存虚拟为显存，无需占用PCB主板额外的空间。

作为独显，锐炬XeMax自然是以独立的芯片形态存在（图6），需要搭配独立的LPDDR4X显存颗粒，通过PCIe4.0总线与CPU相连。但也正是因为独立形态存在，它需要占用更多PCB主板的空间（图7），从而影响轻薄本的集成度。

规格参数的变化

正如前文所述，锐炬XeMax独显在本质上就是第11代酷睿i7集成的锐炬Xe核显的超频版，它们都采用了10nmSuperFin制程工艺打造，内置96个EU执行单元，共计768个流处理器（图8），集成48个纹理单元和24个光栅单元，支持DX12.1、OpenGL4.6和OpenCL2.0API接口以及VRS可变刷新率、适应性同步、同步计算、DLBoostDP4AAI加速指令、AV1视频编码、12位端到端数据，以及eDP1.4b、DP1.4、HDMI2.0b、最多四屏显示等功能。

唯一不同的是，锐炬XeMax独显的核心频率从1.35GHz提升到了1.65GHz（约22%），并可搭配4GB128bit的LPDDR4X-4266MHz显存，不用担心OEM厂商给第11代酷睿处理器搭配DDR4-2666/3200等低频率内存而影响带宽。

此外，锐炬XeMax可以独享25W功耗，在性能上发挥稳定。要知道，很多第11代酷睿轻薄本在拷机测试时功耗只能稳定运行在15W～25W，这还是CPU+GPU的整体功耗。换句话说，锐炬XeMax才能100%发挥出XeLP架构的真正实力。

理论性能的对比

接下来，我们通过3DMark软件对当前热门的核显和主流级别独显进行对比（表2），以96个执行单元的锐炬Xe核显在搭配双通道LPDDR4X-4266内存时的跑分为基准（100%）。作为它的独显版，锐炬XeMax有着大约18.8%的性能提升，可以进一步拉开与GeForceMX350独显之间的差距，已经无限接近18WTDP版本的GeForceMX450了。但是，3DMark毕竟只是理论测试软件，在实际的游戏中，锐炬XeMax独显只能达到GeForceMX350的水平，可以在1080P+最低画质下流畅运行早期的3A游戏大作。

需要注意的是，锐炬XeMax独显的表现还会受到来自英特尔的显卡驱动，以及OEM厂商为笔记本设定的功耗墙和温度墙的影响。宏碁非凡S3X是首发锐炬XeMax独显的轻薄本，但是从网友的实测反馈来看，它在部分游戏和图像渲染工具中会出现贴图错误，而且在以《绝地求生》为代表的游戏中，锐炬XeMax独显运行的流畅度还不如屏蔽独显，直接使用锐炬Xe核显运行的状态。

究其原因，是因为以非凡S3X为代表的轻薄本受制于65W电源适配器，可供CPU+GPU使用的最大功耗只有42W左右。在高负载的环境下，系统会优先确保GPU的功耗输出，留给CPU的功耗则会被压制到10W出头（图9），导致CPU频率骤减，遇到《绝地求生》这种比较吃CPU频率的游戏自然会频频卡顿了。至于为什么核显状态玩这个游戏会更流畅，是因为第11代酷睿在协调CPU和核显功耗分配時更灵活，在确保核显稳定输出时还能避免CPU“拉胯”。

从现有的数据来看，想让锐炬XeMax独显真正以1.65GHz的频率满血输出，需要30W左右的实时功耗，想在玩大型3D游戏时让CPU保持在较高的频率，也需要分配20W或更高的功耗，这需要英特尔和OEM厂商两方面共同协调优化，以升级驱动和BIOS的形式不断改进。

Deep Link技术

在英特尔发布锐炬X eMax独显之前，很多玩家都盼望它能与处理器内集成的锐炬Xe核显组成交叉火力，在玩游戏时能实现1+1≧2的增益效果。

遗憾的是，锐炬独显与核显之间无法“交火”，只能借助DeepLink技术，让锐炬XeMax独显与锐炬Xe核显并行处理推理和渲染项目，提升内容创作工作效率（图10）。根据官方数据，第11代酷睿i7-1165G+锐炬XeMax独显的AI性能较之第10代酷睿i7-1065G7+MX350提升了7倍;在执行超级视频编码项目时，较之第九代酷睿i9-10980HK+RTX2080SuperMax-Q独显的组合还要快1.78倍。

此外，由于是通用软硬件架构，锐炬核显与独显间还支持动态功率共享（DynamicPowerShare），一方空闲时可将功耗空间智能地分配给另一方。但正如前文提到的，非凡S3X在“吃鸡”时对CPU功耗的压制太过激进，显然这一功能还有不小的优化空间。

理性看待锐炬Xe Max独显

就性能而言，采用独立封装和独立显存，独享更高功耗的锐炬XeMax独显的确领先锐炬Xe核显不少，但也谈不上质变，换成实际游戏就是个位数的帧数提升而已。因此，当第11代酷睿笔记本已标配LPDDR4-4266内存的情况下，额外增加一个锐炬XeMax独显的意义真心不大，还会让消费者付出不必要成本。除非你从事AI或图像渲染方面的工作，还需要一款尽可能轻薄的笔记本，第11代酷睿+锐炬XeMax独显的组合才有用武之地。

从另一个角度来看，如果英特尔独显可以受到市场认可，未来推出了取消核显的移动处理器，将更多的晶体管用于强化CPU部分性能，此时再搭配自家的独立显卡，说不定可以在英伟达和AMD的独显市场中分一杯羹（图11）。此外，如果英特尔将来可以实现核显与独显在游戏中的交火能力，也是一种差异化竞争的思路。