生来节能Skylake微架构

2015-10-23 04:07王欣
个人电脑 2015年9期
关键词:制程晶体管功耗

王欣

Tick Tock从时钟指针发出的声响得来,英特尔非常形象地用这种指针前进方式来隐喻自己在半导体领域的发展节奏:每一次Tick代表着同一代微架构下,更新处理器制程(即制造工艺),从而达到缩小芯片面积、减小能耗和发热量的目的;每一次Tock代表着同一代制程下,更新处理器微架构,从而实现处理器性能的提升,进而提升能效。

所谓节能可以包含两方面的意义:尽可能减少能量消耗,生产出与原有同样性能、同样品质的产品;或是以原有相同的能量消耗,生产出性能更强、品质更好的产品。

随着社会的不断进步与科学技术的不断发展,越来越多的国家充分认识到了环境对人类发展的影响。各国都在采取积极有效的措施改善环境,减少能源消耗,因此节能是最关键、也是最直接有效的重要措施,同时也是中国可持续发展的一项长远战略,是我国的基本国策——由此可见节能的重要性。事实上,我国不仅针对节能制定了十二五规划,更是从政策方面给予了全力支持!

英特尔发布的新一代处理器有着 “生来节能”的优秀特性,可同时满足节能在两方面的含义,这与其Skylake微架构息息相关。

Tick Tock钟摆战略

Tick Tock从时钟指针发出的声响得来,英特尔非常形象地用这种指针前进方式来隐喻自己在半导体领域的发展节奏:每一次Tick代表着同一代微架构下,更新处理器制程(即制造工艺),从而达到缩小芯片面积、减小能耗和发热量的目的;每一次Tock代表着同一代制程下,更新处理器微架构,从而实现处理器性能的提升,进而提升能效。

英特尔Tick Tock战略路线图

Tick Tock的周期为两年:偶数年为制程更新年(Tick),奇数年为架构更新年(Tock),这种交错纵横的更新节奏更加有利于处理器芯片的有效发展。

从上图可以看出,自45nm制造工艺下的Core微架构开始,英特尔处理器历经Nehalem微架构—32nm制程—Sandy Bridge微架构—22nm制程—Haswell微架构—14nm制程,发展到现在的Skylake微架构。

14nm制程和3D晶体管技术

制程

制程也叫制造工艺,处理器中有大量晶体管和集成电路,制程可以简单理解为它们的精密度,也就是说制程越先进、精密度越高,那么在同样的面积中就可以制造和容纳更多的电子元器件,连接线路也可以更细更复杂,从而性能也就更好;或者是在同样的性能表现下,制程越先进,那么容纳同样多元器件所用的面积就越小,从而处理器芯片也就越小。

需要注意的是,我们说的纳米(nm)正是衡量制程是否先进的直接标准:nm数越小,就意味着元器件、晶体管以及连接电路的精密度越高,Skylake微架构便基于14nm制程。

3D晶体管技术

3D晶体管的全称是3D Tri-Gate三栅极晶体管。晶体管是现代电子学的奠基石,想必这个说法无人否认,任何电子设备、芯片等都基于晶体管。自晶体管发明以来,它都在使用2D的平面结构,而英特尔公司在摩尔定律的发展下意识到,晶体管技术必须有重大突破才能避免成为发展的壁垒,因此投入巨大人力、物力和财力开发全新一代晶体管技术,于2012年正式发布了基于22nm制程、第一代3D三栅极晶体管技术的Ivy Bridge处理器。3D晶体管不仅在当时被称为是“晶体管历史上最伟大的里程碑式发明”、“年度最重要技术”、“重新发明了晶体管”。

获得如此至高评价并非空穴来风:在材料和制程都有了革命性改变的前提下,传统2D晶体管本身的结构已经成为阻碍电子学发展的绊脚石,我们不妨以一张图来说明问题。

我们先花费一点点文字讲述一下处理器的工作原理:由于晶体管具有开关特性,其开启(电流通过)和关闭(电流阻断)正好能够对应二进制中的0和1,而计算机则是基于二进制算法的设备,因此处理器中需要大量的晶体管来完成指令和数据的处理。从上图中不难看出,传统2D晶体管的栅极(栅极可以理解为晶体管的闸门)控制在通过电流时效率较低,阻断电流时又会有较高漏电流产生,这意味着能量的无谓消耗;3D晶体管则采用了一个薄得难以想象的三维硅鳍片取代了传统2D晶体管上的栅极,且3D晶体管鳍片的三个面都带有栅极,不仅可让电流通过更多更快,还能够通过顶部栅极的辅助控制,来让晶体管在闭合状态时尽可能减少漏电流,体现到处理器上就是能够极大提升性能,同时还可以大幅度降低功耗。

制程和晶体管技术相辅相成,如果没有先进的制程,那么晶体管技术只能是纸上谈兵——很难想象基于32nm制程的3D晶体管达到十数亿级别后,处理器将会是何种样子。基于14nm制程的第二代3D晶体管技术与第一代3D晶体管技术相比,有了更小的间隙从而提升了密度,能够在同样面积的芯片上提供更多晶体管,实现更强性能;同时第二代3D晶体管还有更高更细的鳍片来提升驱动电流和性能,可以通过削减晶体管密度的方式,在更小面积的芯片上提供相同的性能表现,以达到节省功耗的目的——这正契合了节能概念的两重含义。

晶体管不仅用于处理核心和图形核心,更是缓存的基石,因此先进的制程和晶体管技术不仅能够提升处理核心和图形核心本身的性能,还能够提升缓存性能,从而令整个处理器性能得到大幅提升;相应的,这也意味着如果缩小芯片面积,那么不仅能够降低功耗,实现节能,同时也不会令性能打折扣。

节能-无风扇设计之旅

在第六代智能酷睿处理器家族中,尾号为Y的处理器被单独划归至全新的处理器子品牌——Core M、酷睿M处理器。酷睿M处理器最大的特点便是能极大降低功耗,其实际功耗低至4W,以至于基于酷睿M处理器的设备根本无需散热系统支持,从而取消了风扇,进一步节能。

无风扇设计

如果说笔记本电脑的诞生解决了人们对移动计算的需求的话,那么无风扇设计可谓是CPU节能设计的终极目标。在大约10年前,人们对超便携笔记本电脑的概念是重量不超过2.5公斤,续航能力在3-4小时左右,这个数字换到现在想必没有人能够接受——从2010年32nm Westmere处理器开始,到2014年首次推出Core M(Broadwell Y系列处理器),随着处理器技术的不断演进,笔记本的轻薄记录也在不断被打破,与此同时,至关重要的性能和电池续航能力也不断提升——现在,重量不足1公斤,性能满足日常使用需求,续航能力可支撑全天计算的设备比比皆是。

TDP功耗

TDP是英文 “Thermal Design Power”的缩写,字面意思是 “散热设计功耗”。TDP数值代表的意义在于,它给PC系统厂商,散热器制造商以及机箱厂商等提供了一个设计参考,也就是说他们在设计一款产品时,需要考核这个产品满足对应的处理器的TDP,这样才能保证在处理器满负荷工作时提供足够的散热效率,保证处理器温度在设计范围内,从而令处理器稳定工作。

不同处理器的TDP也不尽相同,这就说明即便都是同一代处理器产品,面向的用户目标群体不同的话,处理器本身的表现也不尽相同,需要的散热系统也就不同——在同一代处理器中,TDP越高就意味着处理器可提供的性能越好,但功耗也就相对较大。

毋庸置疑的是,游戏发烧友们一贯追求高性能,以便获得更出色的游戏体验。但另一个问题在于,对移动计算甚至某些行业用户来讲,性能并非唯一需要考量的因素:商用客户希望能有轻薄的笔记本支持越洋飞行;教育行业、网吧客户需要精心核算电费成本……这些用户需要找到性能和功耗之间的平衡点,而这个平衡点也不尽相同——正因为如此,厂商才会推出各种系列的处理器产品来满足所有用户的需求。

设计挑战

无风扇设计需要考量的因素有很多,并非简单降低TDP功耗即可达成:首先,TDP功耗低于6W的设备才有可能采用无风扇设计;其次,一味降低TDP功耗会导致性能严重失调,甚至无法满足普通计算需求;再次,除了处理器之外,芯片组、显示核心等组件都必须达到同样的需求,这对整体功耗协调提出了挑战;最后,这意味着从制程到微架构,从核心部件到整体设计都需要全面考核。

细心的朋友可以发现,当14nm和3D晶体管技术出现之后,无风扇设计的设备才成为了可能。这是因为只有在更加精密的制造工艺和更加先进的晶体管技术支撑下,才能够生产出性能满足需求、功耗控制出色的SoC处理器——所谓SoC,即System On Chip,也就是说平台所需的所有部件都位于一颗芯片上。

实现无风扇设计

为了满足无风扇设计需求,需要对处理器进行技术上的改进,例如:

首先,减小芯片封装尺寸。仅相当于上一代产品63%的面积、0.5mm球形触点间隙、170um的die和200um的核心封装面积都能让Core M处理器有更小的体积,从而能够与更小的主板搭配使用,减少整个设备的体积和重量。

其次,在Skylake微架构中提供有第二代整合稳压设计,这让处理器在低电压状态下有更好的能耗表现。非线性衰减控制技术通过增加电压防护频段,让负载急剧切换时能够保护处理器,而以往为了解决这个问题,只能通过增加电容或者将主板设计的更复杂才能达到同样目的,因此非线性衰减控制技术能够减少电容和简化主板,这也为节能起到了关键作用。

再次,专门设计的3DL模块。这是一个位于芯片底部的稳定电路,3DL通过增大面积来减少厚度,并允许厂商自行根据整个芯片的形状来设计主板,在很大程度上能够定制自己的最终产品模型,便于设计出更轻薄、更个性化的移动计算设备。

最后,显示核芯引入了全新的DCC(Duty Cycle Contrl)占空比机制,DCC可以让图形核心工作在有效的范围之内,当图形核心不工作时还可将其关闭,同时降低功耗——DCC的引入让能够降低接近一半的功耗,或者在同样功耗下提供超过26%的性能提升。

总之, Skylake微架构可以让厚度小于9mm的设备彻底摆脱风扇,待机功耗的降低增强了电池续航能力,大幅度降低了功耗,在实现节能的同时还可提供出色的性能表现。

睿频加速技术2.0

TurboBoost睿频加速是指处理器可监测处理核心工作状态,如有空闲核心,则可将它们的功耗转移至非空闲核心上,来提高非空闲核心的主频,以获取更高性能的技术。睿频加速技术2.0相比1.0,加强了多核心加速的幅度,简单说就是多个核心经过睿频2.0加速后,其主频可提升至更高,处理性能、尤其是多任务处理时也就更好。

睿频加速2.0技术通过处理器内部的功耗控制单元检测每一个核心的温度、电流和功耗情况,并允许将正在处理任务的活动核心加速到TDP功耗之上,当然这个加速是短暂的,但能够超越TDP限制意味着频率提升幅度会更高,处理性能也就更强——可以理解为睿频加速2.0技术允许处理核心短暂超越功耗限制来获得更高性能,从而加速处理任务,提高效率来达到节能的目的。

此外,英特尔智能酷睿处理器中的核芯显卡部分也支持该技术,不仅在显示核心闲置时能够提供额外的超频空间给处理核心,还能够反其道而行之,在处理核心相对空闲,而显示核心工作时,将TDP超频空间转移给核芯显卡,从而实现显示核心的睿频加速。

超线程技术

超线程技术是指通过特殊的硬件指令,让一个物理核心能够模拟出两个核心,从而实现更多线程的并行计算,例如支持超线程技术的英特尔第六代智能酷睿双核处理器,在运算时会同时有4个线程在工作;而四核心处理器则会有8个线程在工作。

提升处理器的主频和增加缓存容量是改善处理器性能最简单粗暴的方式,但这势必会带来功耗方面的剧增——晶体管数量激增不仅对制造工艺和材料提出极高要求,更会降低执行单元的利用率,还会导致处理器本身体积庞大、功耗惊人。超线程技术能够解决这一问题,让处理器发挥更大效率,而不必仅仅把精力放在提升主频和缓存上,就可以提供出色的性能表现。

超线程技术为节能做出了贡献——减少物理核心意味着削减功耗,超线程技术可以做到在物理核心数量更少、功耗更低、更节能的前提下,提供出色的性能。

高速智能缓存

缓存是处理器中的一种临时存储器,它的特点是容量小,但速度远远超过内存。缓存的作用在于能够避免让内存称为系统性能的瓶颈——如果没有缓存,那么处理器在调用数据时只能访问内存,但处理器和内存之间的速度差异过大,因此会造成处理器有相当长的等待时间。引入缓存之后,处理器可以通过缓存这个“中转站”来访问数据,由于缓存速度快,因此内存速度的瓶颈问题就得到了解决。

高速智能缓存是Skylake微架构中又一个重要特性:首先,英特尔为高速智能缓存提供了先进的预读取算法,这极大提高了处理核心调用数据的“命中率”;其次,高速智能缓存并非为某一个核心单独定制,它可以被任何核心全权动态支配,也就是说当某一个处理核心当前对缓存的利用率较低时,其他核心可以动态增加占用缓存的比例,甚至于当某个内核空闲没有工作时,全部高速智能缓存都可以被其他核心调用。最后,这种智能也意味着处理器可以根据自身运行条件,来关闭部分缓存来降低功耗。

为什么缓存和功耗之间有着必然关联呢?这是因为缓存本身就是由大量晶体管组成的,只要有晶体管和相关电路存在,就意味着功耗的产生。事实上,我们常看到的数据,例如某某处理器中有17亿个晶体管等等,这些晶体管中绝大部分都是缓存,处理核心所用的晶体管数量反而只是一小部分。那么既然缓存占用了大量晶体管,就意味着会有较大功耗产生——要么让全部缓存都做到物尽其用,要么在空闲时能够关闭,这也正满足了提供更出色性能、在满足性能条件下提供更低功耗的节能定义。

Skylake微架构让全新处理器满足了节能的两方面含义:在与上一代产品提供相同性能表现的前提下,功耗极大降低;在功耗表现与上一代产品相同的前提下,性能得到了极大增强。这意味着现在用户可以选择基于英特尔第六代智能酷睿处理器(Skylake)的设备,在保证性能的前提下,降低功耗从而为节能做出贡献;或者选择同样功耗的处理器产品,来获取更强悍的性能,从而提高工作效率,完成同样任务的时间更短,能源消耗自然也就更低。□

猜你喜欢
制程晶体管功耗
基于任务映射的暗硅芯片功耗预算方法
2.6万亿个晶体管
台积电又推先进制程增强版本N7P和N5P
功率晶体管击穿特性及测试分析
焊接式轴流风叶的制程与工艺装备保障
揭开GPU功耗的面纱
数字电路功耗的分析及优化
一种新型的耐高温碳化硅超结晶体管
IGBT模型优化及其在Buck变换器中的功耗分析
意法半导体(ST)新款100V晶体管提高汽车应用能