浅析英特尔锐炬Xe Max独显

2020-12-22 07:44
电脑爱好者 2020年24期
关键词:代酷英特尔功耗

22年后再战独显

1998年,英特尔曾经推出过自主品牌的独立显卡——Intel i740(图1),这颗芯片是英特尔以购买Real3D公司20%股权为代价,与其携手合作定制的产品,从而以较小的代价迅速进入了3D图形市场,与同期的3dfx、ATI、NVIDIA、S3、Trident和Matrox竞争。随后,i740还被英特尔整合进了810/815芯片组(改名为i752),构筑了其一统“集显江湖”的基石。可惜,Real3D公司在1999年时倒闭,英特尔的独显品牌之路也戛然而止。

继i740之后,英特尔其实并没有放弃独显产品的规划,曾计划在2010年推出代号为““Larrabee”的独显品牌(图2)。Larrabee号称是第一款实用级万亿次运算图形处理器,其最大特色是在GPU内引入X86指令,从而使得编程更加简单,同CPU之间的数据交换可以保持一致性,大大降低图形应用程序的开发周期和难度。可惜,Larrabee“出师未捷身先死”,由于其性能以及驱动的开发远远落后于原先的计划,最终沦落成为Xeon Phi加速器的项目。

在过去的20余年中,英特尔核显品牌历经了多次迭代,比如去年第10代酷睿IceLake集成的核显就隶属于Gen11,而今年第11代酷睿TigerLake集成的核顯则是Gen12。只是,英特尔对Gen12寄予厚望,后者改用了全新可扩展的向量-矩阵架构,高度可扩展性让它能够针对不同市场推出不同分支的架构和产品,从面向高性能计算市场Xe-HPC,面向数据中心/AI计算的Xe-HP,再到面向游戏玩家的Xe-HPG以及面向移动端的Xe-LP(图3)。

没错,第11代酷睿处理器集成的锐炬Xe(Iris Xe)就是基于Xe LP超低功耗架构打造,而我们今天文章的主角,锐炬Xe Max同样是源于Xe LP定制。从本质上来看,它们其实就是同一颗芯片,可以简单理解为拥有独立显存的锐炬Xe核显超频版。

锐炬Xe Max独显解析

根据英特尔的规划,锐炬XeMax将细分为移动版和桌面版,它们的品牌名称和Logo相同(图4),第一批上市的则是用于轻薄本市场的移动版。我们不妨先将英特尔常见的Gen11/Gen12核显与锐炬XeMax独显进行一下对比,寻找它们的共性与差异(表1)。

存在形式的差异

虽然锐炬Xe和锐炬XeMax都是基于Xe-LP架构设计,但它们核显和独显身份,注定了二者在存在形式上有着本质上的差异。其中,锐炬Xe核显被直接整合进了第11代酷睿处理器基板上的芯片中(图5),通过Ringbus总线与CPU内核连接,并将部分内存虚拟为显存,无需占用PCB主板额外的空间。

作为独显,锐炬XeMax自然是以独立的芯片形态存在(图6),需要搭配独立的LPDDR4X显存颗粒,通过PCIe4.0总线与CPU相连。但也正是因为独立形态存在,它需要占用更多PCB主板的空间(图7),从而影响轻薄本的集成度。

规格参数的变化

正如前文所述,锐炬XeMax独显在本质上就是第11代酷睿i7集成的锐炬Xe核显的超频版,它们都采用了10nmSuperFin制程工艺打造,内置96个EU执行单元,共计768个流处理器(图8),集成48个纹理单元和24个光栅单元,支持DX12.1、OpenGL4.6和OpenCL2.0API接口以及VRS可变刷新率、适应性同步、同步计算、DLBoostDP4AAI加速指令、AV1视频编码、12位端到端数据,以及eDP1.4b、DP1.4、HDMI2.0b、最多四屏显示等功能。

唯一不同的是,锐炬XeMax独显的核心频率从1.35GHz提升到了1.65GHz(约22%),并可搭配4GB128bit的LPDDR4X-4266MHz显存,不用担心OEM厂商给第11代酷睿处理器搭配DDR4-2666/3200等低频率内存而影响带宽。

此外,锐炬XeMax可以独享25W功耗,在性能上发挥稳定。要知道,很多第11代酷睿轻薄本在拷机测试时功耗只能稳定运行在15W~25W,这还是CPU+GPU的整体功耗。换句话说,锐炬XeMax才能100%发挥出XeLP架构的真正实力。

理论性能的对比

接下来,我们通过3DMark软件对当前热门的核显和主流级别独显进行对比(表2),以96个执行单元的锐炬Xe核显在搭配双通道LPDDR4X-4266内存时的跑分为基准(100%)。作为它的独显版,锐炬XeMax有着大约18.8%的性能提升,可以进一步拉开与GeForceMX350独显之间的差距,已经无限接近18WTDP版本的GeForceMX450了。但是,3DMark毕竟只是理论测试软件,在实际的游戏中,锐炬XeMax独显只能达到GeForceMX350的水平,可以在1080P+最低画质下流畅运行早期的3A游戏大作。

需要注意的是,锐炬XeMax独显的表现还会受到来自英特尔的显卡驱动,以及OEM厂商为笔记本设定的功耗墙和温度墙的影响。宏碁非凡S3X是首发锐炬XeMax独显的轻薄本,但是从网友的实测反馈来看,它在部分游戏和图像渲染工具中会出现贴图错误,而且在以《绝地求生》为代表的游戏中,锐炬XeMax独显运行的流畅度还不如屏蔽独显,直接使用锐炬Xe核显运行的状态。

究其原因,是因为以非凡S3X为代表的轻薄本受制于65W电源适配器,可供CPU+GPU使用的最大功耗只有42W左右。在高负载的环境下,系统会优先确保GPU的功耗输出,留给CPU的功耗则会被压制到10W出头(图9),导致CPU频率骤减,遇到《绝地求生》这种比较吃CPU频率的游戏自然会频频卡顿了。至于为什么核显状态玩这个游戏会更流畅,是因为第11代酷睿在协调CPU和核显功耗分配時更灵活,在确保核显稳定输出时还能避免CPU“拉胯”。

从现有的数据来看,想让锐炬XeMax独显真正以1.65GHz的频率满血输出,需要30W左右的实时功耗,想在玩大型3D游戏时让CPU保持在较高的频率,也需要分配20W或更高的功耗,这需要英特尔和OEM厂商两方面共同协调优化,以升级驱动和BIOS的形式不断改进。

Deep Link技术

在英特尔发布锐炬X eMax独显之前,很多玩家都盼望它能与处理器内集成的锐炬Xe核显组成交叉火力,在玩游戏时能实现1+1≧2的增益效果。

遗憾的是,锐炬独显与核显之间无法“交火”,只能借助DeepLink技术,让锐炬XeMax独显与锐炬Xe核显并行处理推理和渲染项目,提升内容创作工作效率(图10)。根据官方数据,第11代酷睿i7-1165G+锐炬XeMax独显的AI性能较之第10代酷睿i7-1065G7+MX350提升了7倍;在执行超级视频编码项目时,较之第九代酷睿i9-10980HK+RTX2080SuperMax-Q独显的组合还要快1.78倍。

此外,由于是通用软硬件架构,锐炬核显与独显间还支持动态功率共享(DynamicPowerShare),一方空闲时可将功耗空间智能地分配给另一方。但正如前文提到的,非凡S3X在“吃鸡”时对CPU功耗的压制太过激进,显然这一功能还有不小的优化空间。

理性看待锐炬Xe Max独显

就性能而言,采用独立封装和独立显存,独享更高功耗的锐炬XeMax独显的确领先锐炬Xe核显不少,但也谈不上质变,换成实际游戏就是个位数的帧数提升而已。因此,当第11代酷睿笔记本已标配LPDDR4-4266内存的情况下,额外增加一个锐炬XeMax独显的意义真心不大,还会让消费者付出不必要成本。除非你从事AI或图像渲染方面的工作,还需要一款尽可能轻薄的笔记本,第11代酷睿+锐炬XeMax独显的组合才有用武之地。

从另一个角度来看,如果英特尔独显可以受到市场认可,未来推出了取消核显的移动处理器,将更多的晶体管用于强化CPU部分性能,此时再搭配自家的独立显卡,说不定可以在英伟达和AMD的独显市场中分一杯羹(图11)。此外,如果英特尔将来可以实现核显与独显在游戏中的交火能力,也是一种差异化竞争的思路。

猜你喜欢
代酷英特尔功耗
Intel公布第14代酷睿细节:3nm工艺真没了
基于任务映射的暗硅芯片功耗预算方法
Intel 10nm初显威力,AMD还得看明年
Intel“火箭湖”来了!全新架构性能起飞第十一代酷睿台式机处理器技术解析
英特尔携手一汽集团,引领汽车行业全新变革
英特尔扩充FPGA可编程加速卡产品组合
数字电路功耗的分析及优化
IGBT模型优化及其在Buck变换器中的功耗分析
英特尔开源帮霍金“说话”软件
好平板有强芯 英特尔Bay Trail芯片解析