处理器、内存、存储和FPGA齐聚首英特尔2020年企业级产品发布会概览

2020-08-11 14:25李实
微型计算机 2020年14期
关键词:数据格式英特尔内存

李实

2020年是一个不平凡的年份。由于特殊时期的大量展会被取消,企业转而改用线上的形式发布今年的新品或者发展计划。6月19日,英特尔召开线上发布会,向全球用户公布了旗下2020年面向企业和商业用户的全新产品和技术。其中硬件方面包含了内置AI加速技术的第三代至强处理器、傲腾200系列持久内存、高容量3DNANDSSD,以及首个为AI优化的FPGA产品,软件方面则展示了英特尔在OneAPI计划上的一些进展和英特尔对企业级用户在IT管理方面的一系列精选方案升级等。接下来,我们就一起来了解一下,英特尔在2020年究竟会为用户带来怎样的惊喜。

支持AI计算加速的全新至强处理器

至强处理器是英特尔在服务器和数据中心领域的核心产品。在本次发布会上,英特尔推出了全新的第三代至强可扩展处理器。第三代产品包含11款新品,其中白金系列产品为6款,金牌系列产品为5款。其中,最顶级的处理器型号为XeonPlatinum8380HL,拥有28核56线程,基础频率为2.9GHz,睿频可达4.3GHz,TDP功耗为250W,缓存为38.5MB。内存方面支持DDR43200(1DPC)或者DDR42933(2DPC),最大内存容量支持每个插槽4.5TB,支持4路或者8路配置。在8路配置下,最多可以在一个机架中实现224个处理器核心和448路线程的配置方案,这也是英特尔目前提供的最强大处理器之一。

相比上代产品,新的第三代至强可扩展处理器在工艺制程和核心数量上没有太多的变化,其主要升级放在规格和对AI加速的支持上。新的第三代至强可扩展处理器带来了对Bfloat16规格的支持。所谓Bfloat16,是一种数据格式,也可以被称为BF16或者Truncated16-bitfloatingpoint截断16bit浮点数。Bfloat16的主要形成方法是将一个完整的FP32浮点数的前16位截断生成。这个数据格式是由谷歌提出,最早使用在谷歌专用的TPU中。Bfloat16的优势在于,其计算精度和FP16相当,但是又具有和FP32一样的大动态范围,所以Bfloat16只需要一半的比特数(或者计算量)就能达到和FP32类似的模型精度。不仅如此,Bfloat16还能够解决深度学习计算中由于精度不足导致底层的降低梯度消失等问题。比如每一层深度学习计算的梯度相乘得到的小于1的浮点数,层数越来越多之后,这个数会进一步缩小至难以使用,而使用Bfloat16就能避免出现这种问题。

在引入了Bfloat16支持后,英特尔带来处理器在AI计算方面性能的跃升。英特尔的数据显示,在其自家的深度学习测试环境中,相比之前常用的FP32数据格式,新的Bfloat16数据格式拥有1.93倍的训练性能,同时还能够输出几乎一样的结果;或者带来1.9倍的推力性能,同时也输出一样的结果。英特尔还在更广泛的范围内对比了Bfloat16数据格式和FP32数据格式的性能差异。比如阿里云使用Bfloat16运行NLP计算的吞吐量达到传统格式的1.58倍,推理计算达到传统格式的1.83倍;在海鑫科金的生物統计学计算中,Bfloat16数据格式的计算吞吐量是FP32数据格式的1.97倍;在腾讯云的查询引擎中,Bfloat16数据格式的计算吞吐量是FP32数据格式的1.68倍,在TTS计算中的吞吐量也达到了1.54倍,推理计算更是达到了1.89倍。

除了Bfloat16数据格式外,英特尔还带来了对INT8数据格式的支持。这种数据格式计算负载更低,但是计算精度同时也有一定程度的下降,适合在要求较低的场合使用。英特尔的数据显示,在AI的推理计算中,以第三代至强可扩展处理器为例,FP32的性能指数是2.04,这还是动用处理器内置AVX-512加速模块的情况下,而INT8的性能则高达6.25,Bfloat16的性能也高达3.66,这三种推理计算都能得到合理的结果,显然在这种条件下采用INT8格式是更为合理的。

在相关处理器芯片组的选择上,英特尔本次也带来了C620A芯片组和新的第三代至强可扩展处理器搭配的案例。新的C620A芯片组能够提供最多20条PCIe3.0通道、最多10个USB3.0接口、最多14个SATA3.0接口以及支持包括PlatformManageability、ASR、StorageManageability等技术。英特尔展示的案例中,C620A搭配了4路第三代至强可扩展处理器,每一个处理器都提供了6通道DDR4内存、最多48条PCIe3.0通道的规格,并且四颗处理器通过英特尔UPI总线两两链接,整体规格令人咋舌。

另外,英特尔还在发布会上提到了处理器的发展路线图等问题。2020年目前发布的至强可扩展处理器采用的架构代号是CooperLake,平台被称为Cedarisland,支持4~8路处理器。今年还将发布基于10nm生产工艺,架构代号为IceLake、Whitley平台的新产品,只支持1~2路处理器,这应该是面向中小企业或者个人用户的产品。在2021年,英特尔还将发布1~8路、架构代号为SapphireRapids的处理器和名为“EagleStream”的平台,并加入下一代深度学习加速技术AMX。当然现在没有太多有关这些新技术的消息,只有等待英特尔接下来再为我们揭示了。

全新的英特尔200系列傲腾持久内存

英特尔的傲腾持久内存是近几年IT业界最大的技术创新之一。随着英特尔的推广和其本身技术的发展和优势的显现,越来越多的IT厂商开始考虑这种介于DRAM和SSD之间的存储产品。在本次发布会上,英特尔宣布有超过200家500强企业使用了傲腾内存产品,带来了包括存储性能改善、数据吞吐量大幅度提升以及更快的处理时间等优势。如今,英特尔又推出搭配第三代至强可扩展处理器的200系列傲腾持久内存。其主要技术特性包括最大容量可以提升至每处理器4.5TB、以及25%的内存带宽提升等。这所有存储性能的提升都带来了I/O瓶颈效应的降低、更快的数据处理速度以及更好的应用性能等。

新的200系列傲腾持久内存目前有三款产品,容量分别是128GB、256GB和512GB,TDP除了512GB的产品为18W外,其余两款产品都仅为15W。速度方面,根据不同的读写场景,128GB和256GB款最大速度可达6.8GB/s,最小速度也有0.45GB/s和0.58GB/s,512GB款最大速度降低至5.3GB/s,但是最小速度能达到了0.47GB/s。当然,200系列的傲腾持久内存是配合第三代至强可扩展处理器推出的,暂时不清楚是否可以使用在之前的产品或者普通用户电脑中,这还有待英特尔给出更多的相关资料才能确定。

全新的英特尔3D NAND固态硬盘

英特尔在SSD产品上一向以高可靠性、高性能和大容量著称。这一次英特尔发布的两款新品SSDD7-P5500和SSDD7-P5600面向的是需要大容量存储用户。这两款新SSD采用了英特尔最新的TLC3DNAND技术以及全新低延迟PCIe控制器,能够满足AI及分析工作负载的密集I/O需求,并具有提高IT效率和数据安全性的高级功能。英特尔的数据显示,相比前代产品,这两款SSD最多可降低40%的延迟、提高33%的性能。具体到每款产品来看,P5500可以提供高达2倍的顺序性能、P5600提供最高44%的随机混合工作负载性能提升。另外,这两款新品都能够降低几乎所有场合下高达80%的随机4K读取延迟。

在安全性能方面,这两款新的SSD提供了一些固件增强功能,用于提高IT效率和数据安全性,包括动态名称空间管理支持更多用户扩展、支持TCGOpal2.0和内置了AES-XTS256加密、增强的SMART监控、可以在不中断I/O数据流的情况下向外界报告驱动器运行情况、新的Telemetry2.0数据日志、优化的TRIM功能、新的电源损失保护方案等。

在产品规格方面,D7-P5500包含1.92TB、3.84TB和7.68TB这三种规格,并均支持PCIe4.0x4接口和NVMe1.3c规范,128KB数据的最大读取速度为7000MB/s、最大写入速度为4300MB/s。随机4K性能为读取/写入1M/130KIOPS。D7-P5600则更看重随机性能,其容量包含1.6TB、3.2TB和6.4TB三种,也支持PCIe4.0x4接口和NVMe1.3c规范,128KB数据的最大读取速度为7000MB/s、最大写入速度为4300MB/s,随机4K性能则大幅度提升至读取/写入1M/260KIOPS。这两款产品的最大功耗都为20W,且都提供5年质保,可见英特尔对自家产品信心十足。

英特尔首个为AI优化的FPGA产品

英特尔本次发布会上带来了旗下首个为AI计算优化的FPGA—Stratix10NX。根据英特尔的描述,这款产品是英特尔首个针对高带宽、低延迟AI加速所设计的FPGA类产品,它能够针对自然语言处理、欺诈识别、智慧城市等需要极高计算需求的场合进行定制化、重配置、可扩展AI加速等操作。Stratix10NX使用了HBM内存、板载高性能网络接口以及全新的AITensorBlock。值得一提的是,新加入的AITensorBlock替代了之前的DPS模块,其内部包含了大规模的低精度乘法器密集阵列,能对目前主流的AI计算所需要的乘加计算进行加速,这极大提升了FPGA在AI计算方面的效能。

在相關产品特色方面,新的FPGA加速计算核心能够以前代产品15倍的速度实现对INT8数据格式计算的加速,并且其硬件可编程的特性使得用户可以根据自己的AI计算需求对硬件进行重新定义。内存带宽方面,在使用了HBM内存之后,Stratix10NX大幅减轻了数据带宽约束,释放了更多的计算效能。在网络性能方面,Stratix10NX配置了最大57.4G的收发器搭配英特尔以太网络模块,并且这个规格也是可以根据用户需求进行定制和改善的。最后,Stratix10NX还可以根据不同的场合和应用环境,以Chiplet的方式搭配客户指定的ASIC芯片,以实现整个系统的效能最大化。总的来看,英特尔将AI计算和FPGA结合起来,显然是瞄准了定制市场对AI计算的需求,在拥有了Stratix10NX这样的产品后,大量的计算将更有效率地在新的FPGA上运行,这将进一步推动定制化市场AI的发展速度。

计算创造无限未来

从本次发布会来看,英特尔在搭建自己的面向企业和商用的AI计算平台的道路上又前进了一步。无论是支持全新Bfloat16格式的第三代英特尔至强可扩展处理器家族,还是与之相配的200系列傲腾持久内存,全新的大容量SSD产品,以及首个为AI优化的FPGA产品,都带来了英特尔2020年在AI计算加速上的重大突破。未来的世界是不是AI的世界,目前还有待进一步观察,但是当下AI计算的火热,给所有参与其中的企业带来了一个切入市场热点的最好机会。英特尔目前要做的,就是提供最合适和最强大的计算能力,让计算创造世界的未来,也创造英特尔自己的未来。

猜你喜欢
数据格式英特尔内存
外部高速缓存与非易失内存结合的混合内存体系结构特性评测
英特尔携手一汽集团,引领汽车行业全新变革
“春夏秋冬”的内存
在智能交通系统中PLC数据格式转换方法的研究
英特尔扩充FPGA可编程加速卡产品组合
论子函数在C语言数据格式输出中的应用
DWG与SHP数据格式互转换方法研究——以龙岩规划测绘数据为例
英特尔开源帮霍金“说话”软件
好平板有强芯 英特尔Bay Trail芯片解析
基于内存的地理信息访问技术