数据中心空调系统AI调优节能应用

2024-01-17 03:23邢殿辉马胜明胡孝俊中讯邮电咨询设计院有限公司北京00048中国联合网络通信集团有限公司北京000杭州紫光通信技术股份有限公司浙江杭州0000
邮电设计技术 2023年12期
关键词:冷水机组冷却水机房

贺 晓,邢殿辉,刘 湃,马胜明,许 俊,胡孝俊(.中讯邮电咨询设计院有限公司,北京 00048;.中国联合网络通信集团有限公司,北京 000;.杭州紫光通信技术股份有限公司,浙江杭州 0000)

0 引言

近年来,国家高度重视新型基础设施的建设,特别是在信息技术和云计算领域,数据中心作为这一领域的核心设施备受瞩目。随着数据需求的不断增加,数据中心的能源需求也逐渐成为一项重大挑战。在这一背景下,国家发展改革委员会、中央网信办、工业和信息化部以及国家能源局于2020 年12 月联合发布了《关于加快构建全国一体化大数据中心协同创新体系的指导意见》。该文件设定了到2025 年的目标,即将大型和超大型数据中心的运行电能利用效率(PUE)降低至1.3 以下[1-2]。为达成这一目标,研究人员一直在积极寻求减少数据中心能源消耗的方法。值得关注的是,在数据中心总能耗中,空调系统的消耗比例高达40%~60%[3-5]。人工智能技术在空调节能领域正展现出巨大的潜力[6-9]。通过数据分析和智能控制,人工智能技术可以对空调系统进行优化,从而实现节能和降低运营成本的目标。

1 系统建模

数据中心中央空调系统包括末端和冷源系统两大主要组成部分。在整个空调系统中,冷水机组的能耗占比最大,因此以往空调系统的研究主要关注冷水机组的节能[10-13]。然而,由于空调系统内部各设备之间存在强耦合性,各个设备对整个空调系统性能的影响程度各不相同。因此,在实施节能优化时,需要综合考虑多种复杂因素。

1.1 末端空调系统能耗优化

末端空调系统的运行控制一般需要依据机房现场的测点温度变化进行相应的调整,数据中心机房温度场受服务器IT 负载、末端空调风机转速等边界条件影响,随时间、空间分布变化,物理过程较为复杂。使用传统的流体动力学、传热学机理分析方法建立的简单温度分布模型难以准确描述机房内各监测点温度随时间、空间分布的变化,更难以及时捕捉不同服务器IT设备旁的局部热点,使得机房IT设备具有过热隐患。因此,本项目采用针对数据中心的CFD 仿真软件和马尔可夫决策过程模型来对数据中心机房末端进行优化。

1.1.1 末端机房CFD建模

首先,依据建模资料构建出机房建筑框架,具体包括天花板、墙体及高架地板、数据中心机柜及空调,封闭冷通道等,然后将机房离散化处理以完成仿真,依据实际情况,对于空调出风口、IT 设备附近、传感器周围等温度、气流流速变化大的关键位置的网格参数进行调整[14-15]。通过仿真求解,可以得到整个机房的温度、气流等分布情况,结果如图1所示。通过编写交互接口,可以将各个传感器探测到的温度批量导出用于后续计算。

图1 数据中心机房CFD仿真结果

1.1.2 末端空调系统马尔可夫决策过程模型

建立马尔可夫决策过程模型需要合理选取参数(S,A,T,R,γ)。本节将依据数据中心现场调研情况,综合考虑末端空调系统的节能和保证IT 设备热安全的目标,构建数据中心末端空调系统马尔可夫决策过程模型。

a)状态S选取。状态量的选取应充分包含数据中心末端机房环境的必要信息,以便于强化学习智能体的训练。在本研究中,选取冷热通道的温度和各台IT设备的负载作为状态量,即:S={Tc,Th,HIT},其中Tc为冷通道各温度传感器数值组成的温度向量,Th为热通道各温度传感器数值组成的温度向量,HIT为机房内各机柜IT设备负载组成的向量。

b)动作A选取。动作量一般依据末端空调系统的控制变量选取,考虑到现场实际只允许调控回风温度设定点,因此选取Tre为动作量,即:A={Tre},其中Tre为各空调回风温度设定点组成的向量。

c)奖励函数R设计。奖励函数的设计应充分考虑到项目目标,引导智能体不断向任务目标前进。考虑到本项目的节能性和安全性两大指标,可以合理设计奖励函数为:R=λRP+RT,其中,RP为空调系统运行功耗对应的收益,也即对空调制冷能耗的惩罚,RT为服务器IT 设备出风口温度对应的收益,也即对服务器温度越过冷热安全边界的惩罚。

d)其他参数。系统状态转移函数T反应了系统的动态特性,本研究采用免模型的强化学习方法,该类方法不需要马尔可夫决策过程中的系统状态转移函数T显式已知,而是在与环境不断交互的过程中直接学习到最优控制策略。折扣因子γ∈[0,1]影响智能体对“未来”状态和“未来”奖励的重视程度,γ越偏向于1,表示智能体越倾向于长远考虑。

1.2 冷源能耗建模

数据中心设备能耗巨大,室内空气温度要求高,需全年制冷。在能够调节运行参数寻找满足末端运行需求的能耗最低的控制算法之前,必须先建立冷源设备能耗模型,即建立空调系统中各设备能耗和运行参数的关系。根据实际数据拟合数据中心空调系统各个设备的能耗与运行参数间关系的模型,具体模型搭建包括冷水机组、冷冻泵、冷却泵和冷却塔。

1.2.1 冷水机组能耗模型

冷机模型的输入、输出、模型参数如图2所示。

图2 冷机模型的输入、输出、模型参数

在进行冷机能耗模拟时,计算冷机能耗需要考虑冷机的制冷量和能效比(Coefficient Of Performance)。

其中,制冷量根据冷冻水进出水温差和流量计算:

式中:

Ge——冷冻水质量流量

cp——冷冻水定压比热容,取cp=4.17 kJ/(kg·K)

Teo——冷冻水回水温度

Tei——冷冻水送水温度

由于现场实际传感器布置的数量和位置有限,所采集的数据并不能完全满足建立准确物理模型的需要,在实际应用中,可使用冷水机组冷冻水、冷却水的实测数据与额定数据进行冷机能效比预测。

式中:

Qr——冷水机组额定制冷量

Ge,r——冷水机组冷冻水额定流量

Gc——冷却水质量流量

Gc,r——冷水机组冷却水额定流量

Tei,r——冷水机组冷冻水额定送水温度

Teo,r——冷水机组冷冻水额定回水温度

Tci——冷却水送水(冷机)温度

Tci,r——冷水机组冷却水额定送水温度

Tco,r——冷水机组冷却水额定出水温度

1.2.2 泵与风机能耗模型

水泵和风机的能耗模型采用与流量比成三次方关系的简化模型,如式(4)所示,并在拟合中根据实际数据调整模型系数:

式中:

apump——模型待定系数

G——水流量(kg/s)

Gr——水泵额定水流量(kg/s)

Er——水泵额定功率(kW)

2 优化方法与优化过程

为了最终实现数据中心空调系统的优化运行,在建立数学模型之后,还需确定优化目标与约束条件,如式(5)所示:

式中:

P——冷水机组、冷冻水泵的总功率(kW)

Pchiller——冷水机组功率(kW)

Ppump1——冷冻水泵的功率(kW)

Ppump2——冷却水泵的功率(kW)

PFRe——冷冻水流量与额定流量的比值

Te,in——冷冻水供水温度(℃)

Ti,in——冷却水回水温度(℃)

fe,pump、fi,pump、ffan——冷冻泵频率、冷却泵频率、风机频率(Hz)

由于该优化目标是非凸优化,用传统优化方法和优化求解器难以直接解得,因此本项目采用基因算法对其进行最优化。基因算法(Genetic Algorithm,GA)是模拟生物进化论的自然选择和遗传学机制的搜索算法。基因算法是一种启发式的全局搜索算法,用于寻找给定函数的最大值或最小值,其基本思想是从一组可能的解决方案(种群)开始,然后通过迭代选择、交叉(为配对)和突变来改进这些解决方案,直到满足优化停止条件。

3 AI调优节能技术试点应用

3.1 项目概况

本研究以某数据中心机房为研究对象。该机房空调系统有3台水冷离心式冷水机组,按照2用1备的模式运行,每台机组制冷量为3 340 kW(950RT),机组冷冻水进水温度为12℃,出水温度为7℃,冷却水进水温度为32℃,出水温度为37℃。机房设置有空调自控系统(BA),系统主要对暖通空调系统进行监控,系统设计采用分布式楼宇自控系统。因机房建设时间较早,冷水机组、末端空调等设备不能满足AI 调优的需求,因此需要对系统进行前期改造。

3.2 改造工程

3.2.1 末端改造

机房温度场建模需要采集机房内各个温度监测点的数据,才能对模型进行合理整定,1~3 楼每个冷通道只有2个传感器,热通道内均没有传感器,不能满足机房建模的数据采集需求,需要在冷通道添加适量传感器(见图3)。

图3 温度传感器布置示意

在冷通道加2个温度传感器,贴在机柜的下方,热通道(机柜的另一侧)加8 个温度探头,每侧4 个,大致每隔4个机柜放置1个温度探头,贴在机柜的上方。

冷热通道新增温度采集点位,采集送风和出风温度,所有点位均通过新增采集单元接入至现有动环平台(见图4和图5)。

图4 1层动环新增点位平面图

图5 2~4层动环新增点位平面图

3.2.2 冷源侧BA改造

在1层冷冻站内的冷水机组主机控制屏增加通信模块,将冷机运行数据上传至BA系统,共需增加3台。

冷水主机冷冻水侧、冷却水侧供回水管均需增加压力传感器、温度传感器,冷冻水侧、冷却水侧供水管增加电磁式流量计,实时监测系统流量、温度、压力,作为调优系统的参数输入。

将新增的3台冷却塔变频控制柜、3台冷却水泵变频控制柜、2 台冷冻水泵变频控制柜的变频控制接入BA系统。

由于点位增加,需要新增3台DDC控制器,将新增冷水主机通信模块、传感器和变频控制柜信息需接入DDC控制器,DDC控制器再接入现有BA系统。

对BA 系统现有末端数据进行校核,冷却塔9个风机出水口增加电动阀,使冷却水被充分有效利用(分流),为确保末端机房的安全,对不具备自保持的设备,增加设备断电自保持功能。

综合上述优化方案,BA系统的架构如图6所示。

图6 BA系统架构

4 AI调优节能技术试点应用结果分析

为评估AI调优算法的性能,依据数据中心现场运行的数据集,选取典型的20天冷源数据作为对照工况(不对系统进行优化),数据用于系统模型建立和强化学习的训练。选取典型的20 天冷源数据作为优化工况进行案例分析。系统优化期间,优化间隔为1 h,因此共有24×20=480 条优化结果,图7 是部分优化结果示意。

图7 部分优化结果示意

数据中心服务器能耗很大,室外温、湿度对室内冷负荷的影响远远低于服务器散热的冷负荷,测试期间机房服务器运行比较稳定,因此认为测试前后是相似工况。按照时间顺序对日期按照1~20进行排序,优化前后空调能耗对比如图8所示。

图8 数据中心优化前后制冷能耗对比

据统计,在对照工况下,制冷系统的单日平均能耗为17 128.64 kWh,平均能效为2.11,平均PUE 为1.90;在优化工况下,制冷系统的单日平均能耗为15 935.07 kWh,平均能效为2.22,平均PUE 为1.87。与对照工况相比,制冷系统优化后平均节能率为6.97%,平均能效提升5.68%。

5 结束语

本文提出了一种通过利用人工智能技术和CFD技术对数据中心的空调建模调优的方法,并基于该方法完成了对某数据中心的节能改造,得出了以下结论。

a)通过结合系统建模和AI 计算可以解决空调系统优化中的耦合问题。

b)考虑末端气流组织的制冷系统的优化过程可以在更好地逼近节能极限的同时保障机房的热安全性。

c)通过对制冷系统末端和冷源侧的优化,某数据中心实现了6.97%的节能率,说明AI 技术在制冷系统的优化调节中具有很大的节能潜力。

猜你喜欢
冷水机组冷却水机房
油田主机排气阀冷却水泄漏故障分析及修复
水冷磁悬浮变频离心式冷水机组
中国核电站冷却水“热污染”调查
N通信公司机房节能技改实践
中央空调冷却水系统节能研究
新型有线电视机房UPS系统的配置
大功率发射机房冷却送风改造
克莱门特冷水机组系统节能应用会议顺利召开
一种发动机冷却水管总成
谈有线电视前端机房的防雷接地