双碳背景下的智算中心供电系统架构优化分析

2024-01-17 03:23杨瑛洁中讯邮电咨询设计院有限公司北京00048环球电信资本合伙控股有限公司香港999077
邮电设计技术 2023年12期
关键词:油机数据中心架构

阮 勇,成 军,田 洁,闫 健,杨瑛洁(.中讯邮电咨询设计院有限公司,北京 00048;.环球电信资本合伙控股有限公司,香港 999077)

0 引言

我国明确提出2030 年实现碳达峰,在国家碳达峰、碳中和目标下,推进数据中心行业的低碳转型对我国实现“双碳”目标具有重要作用。国家政策促使数据中心节能降耗工作成为重要议题。实现“双碳”目标必然以能源为主战场,电力是其中的重要环节。因此,在“双碳”目标快速推进的背景下,供配电系统变革的顶层设计势必会加速推进。在此背景下,数据中心行业从业者需要重点关注如何在保障数据中心安全可靠运行的前提下,降低能耗并提升电能使用效率。

1 智算中心特点

为科研机构和政府、高校服务的超算中心主要执行大规模科学计算和模型训练任务,因此更加注重算力和精度。而面向公众业务的数据中心则更加商业化,通常承载云计算和云业务,强调互联和云服务以及服务的连续性。不同于超算中心和数据中心,智算中心通过领先的体系架构设计,以算力基建化为主体、以算法基建化为引领、以服务智件化为依托、以设施绿色化为支撑,从基建、硬件、软件、算法、服务等全链条开展关键技术落地应用。智算中心至少有2个方面的需求:一方面,由于算力业务相关设备功耗高,散热要求高,所以智算中心对动力和制冷效率要求很高。另一方面,智算中心中的云计算业务仍然提供云服务,相关设备虽然功耗不高,但是对于业务连续性的要求很高。智算中心中的云服务与算力服务同时运行,不间断与可间断业务协同,同时为客户提供服务。智算中心与超算、数据中心的区别如表1所示。

表1 智算中心与超算、数据中心的区别

算力设备的高功耗对智算中心的基础设施提出了更高的要求。首先,制冷设备从以前风冷、水冷演进至现在的液冷,这使得供电系统的要求也随之变化。其次,供电系统小型化是必不可少的,降低供电设备的占地空间势在必行。另外,智算中心的平面布局要求与数据中心相比产生了较大变化,结构上承重要求更高,建筑空间需要具备弹性可调、灵活适配的特点。

2 智算中心供电解决方案

2.1 智算中心供电系统架构的变化

2.1.1 使用一体化电源/电力模块设备节约电力室占地

传统数据中心的供配电系统普遍采用分散式的结构。电力室分为高压室、变配电室、低压室、UPS/HVDC 室、电池室等,类型多且布局分散,占用面积大。电源设备由不同的厂家生产,高压柜、低压柜、交/直流不间断电源系统分散部署在不同的机房。供配电系统的一次和二次线缆都需要现场连接,即使是相邻的配电柜进出线也需要上下翻折,线缆线路长、损耗大,后续的线缆检修和系统扩容难度高。近年来,为提升供配电系统效率,减少供电级数,缩短供电链路,预制化电源概念得到了越来越广泛的应用。

一体化电源或者电力模块设备将中压柜、变压器、UPS、HVDC、馈电等预制集成交付,减少电力室面积高达50%。

以某数据中心为例:该数据中心5~6 层IT 负载功率达8 400 kW,年用电量为9 169 万kWh。采用一体化电源设备后,按照系统能效提升1%计算,每年可节约92万kWh,减少二氧化碳排放561 t。一体式电源系统采用全铜排连接,节省大量柜间连接电缆,配电柜数量减少30%,施工周期大幅缩短,相比传统方案共节约投资15%(节约310 万元)。按照一体式电源方案,该数据中心单层可新增机柜80 架,单柜市场出租价格约为8 万元,则5~6 层年新增创收1 280 万元(不含带宽收入)。若全楼采用一体式电源系统,每年可增收3 840万元。

2.1.2 使用DR或者RR供电架构节约电力室空间

传统数据中心目前主流的供电架构是2N 架构。这种架构建设简单、维护便捷,供电设备购置费用不高,使用标准化方式推广非常方便,得到了业内的广泛认可。近年来,单机柜功率密度持续提升,从4 kW/6 kW/8 kW 提升至10 kW 以上,如果单机柜功率密度继续快速提高,那么电力室面积必然随之大幅度增加。这时建设方案需要更多考虑供电系统的占地面积,同时也应更重视提高供电效率。

与2N 架构相比,DR 架构(见图1)和RR 架构(见图2)在提升系统利用率和降低占地面积上有优势。实际上只要在规划设计阶段做好负荷分配,DR 架构和RR架构的可维护性和可用性也是比较高的。

图1 DR供电系统架构示意

RR架构属于N+1配置,电源设备相对投资小。三大通信运营商的通信机房较多使用RR 架构,数据中心使用较少。RR 架构可以使智算中心的供电系统的利用率从50%提升到N/(N+1),同时将占地面积减少(N-1)/2N。RR 架构的备用系统长期空载,主用系统长期满载,当任何一套主用系统断电或维修时,它所承担的负荷由备用系统带载。

DR 架构属于“手拉手”结构,在海外数据中心使用较多,国内较少使用。DR 架构中配电设备使用减少接近25%,电源设备成本低。每套系统需要分别物理隔离,土建成本高。由于不同源的电缆路由难以实现隔离,发生故障时负载分别带往其他电源,故障定位时间长。

2.2 智算中心备用电源变化导向更灵活

数据中心负荷快速增长后,业界普遍的做法是在高压侧使用高压油机并机形成资源池,这样做可以使油机的容量得到更高效的利用。面向智算中心新的负荷需求,为了与DR 架构和RR 架构相匹配,油机的供电架构也将发生新的变化。智算中心的供电连续性要求发生了变化,不是所有负荷都需要不间断供电。部分负荷需要配置后备电源,而部分负荷则不需要。柴油发电机组的供电架构也将发生变化,市电和油机不一定全部在高压侧切换,可以在低压侧切换或在高压侧分散切换。另外,随着智算中心的到来,需要使用的油机容量越来越大,是否需要进一步提升单台油机的功率,从而降低油机占地面积,仍然是业内讨论的热点话题,需要结合油机、配电柜、电缆等设备材料价格以及负荷容量、安全等多方面因素综合考虑。

2.3 智算中心供电可靠性提升

随着智算中心功率密度的增大,数据中心供电架构的复杂度日益提升,以及电力模式部署方式的出现,都对系统供电可靠性提出了挑战。

未来智算中心基础设施建设将更加注重供电系统的容错性、可用性,确保在运营状态、检修状态以及意外事件发生时,系统仍能正常运行。这就要求统筹考虑供电系统的检修计划、故障隔离等因素,并完善拓扑结构设计,配置完善的自动控制系统,以提高系统可用性。

另一方面,由于数据中心供电系统的集中化部署,后端负荷距离电源点越来越近,因此需要更加重视供电系统的上下级开关保护配合,包括发电机保护、高低压开关配合保护等。配电系统的保护选择性至关重要,但却经常被忽视。不少数据中心在检修、系统投切或遭受供电冲击时发生故障,导致系统稳定性较差。上下级开关的保护配合需要考虑供电系统的各个层级、各种运行工况以及所有设备运行特性。由于供电结构日趋复杂,要完全实现上下级保护装置的全选择性并避免发生越级跳闸极具挑战。在规划设计阶段,设计人员可尝试使用ETAP、SKM 仿真分析软件辅助电力系统设计,以实现精细化设计。

2.4 需求侧响应对备用电源的影响

电力需求响应是电力用户根据电力市场价格信号或激励措施,在电网运行高峰或低谷时期自愿改变其用电行为,减少或增加用电负荷,从而获得一定经济补贴,以促进电力供需平衡、保障电网系统稳定运行的行为。目前需求侧享有相关政策支持,即国家电网出台的电价优惠政策。当新能源接入量大、电网调控力度及灵活性不够时,电网希望更多用户参与到需求侧响应中来。只要用户有电池和柴油发电机组,就有条件参加电网需求侧响应。当用电负荷高、电网的发电能力紧张时,且部分用户无用电需求,这部分用户可把自己多余的电能输配到电网,同时由于参加需求侧响应而得到电费补偿。

需求侧响应分为约定响应、实时响应、季节性响应,并根据响应时长的不同有不同的补贴标准。数据中心用户参与需求侧响应有极大的便利性。例如,某数据中心有1 000 kW 负荷参与需求侧响应1 h,可得到1.2万元的收入。

3 智算中心供电效率提升与全直流供电

目前数据中心交流供电系统的供电效率已经达到了96%左右,采用一体化电源的集成模式可以使供电系统的供电效率提高约1%。当整体的供电链路效率达到97%时,如果再继续提高供电效率,可以采用ECO供电模式或全直流供电模式。

ECO 供电模式是全部负荷由旁路供电,当旁路出现故障时,快速切换至带蓄电池的主用回路。以UPS系统为例,原来的ECO 模式下,逆变器处于冷备用状态,存在切换不及时的风险。目前,厂家把逆变器设置为热备用状态,当旁路故障时,可以在允许时间内从ECO模式切换到主用供电回路。

全直流的供电模式是一种全新的供电架构,是供电系统将来发展的一个方向,可以减少交直流变换的环节,因此供电效率将会更高。全直流供电模式采用10 kV 电力电子变压器,输出的是±375 V 直流电。±375 V 直流电可以很好地适配新能源供电,光伏、储能、充电桩等可以快速接入全直流系统。全直流供电系统演进路线如图3 所示。

图3 全直流供电系统演进

4 结束语

伴随着生成式人工智能、大计算、大模型的快速发展,智算中心的单机柜功率将远大于传统数据中心,对可靠、高效供电的需求将越来越高。一体化电源在供配电技术领域的应用属于重大创新,具备节省占地面积、集约高效、交付周期快速等特点,在供配电技术领域具有重要的应用和推广价值。未来,全直流供电架构由于减少交直流变换环节,从而有效提升供电效率,将是供配电系统的一个重要发展方向。

猜你喜欢
油机数据中心架构
基于FPGA的RNN硬件加速架构
酒泉云计算大数据中心
功能架构在电子电气架构开发中的应用和实践
大数据中心高压油机供电模式探讨
民航绿色云数据中心PUE控制
LSN DCI EVPN VxLAN组网架构研究及实现
10kV油机在大型数据中心的并机控制与切换方案探讨
基于CRUISE软件1.6L油机匹配某轻卡动力总成分析
基于云计算的交通运输数据中心实现与应用
一种基于FPGA+ARM架构的μPMU实现