新基建背景下数据中心评估体系研究

2020-12-28 10:13钦,杨
通信电源技术 2020年17期
关键词:功耗数据中心可靠性

徐 钦,杨 玲

(中通服咨询设计研究院有限公司,江苏 南京 210019)

0 引 言

国内数据中心市场规模在各行各业蓬勃发展的影响下快速增长。预计2020年我国IDC市场规模继续保持高速增长,市场规模将接近2 000亿元。预计2021年和2022年,我国IDC市场规模将迎来爆发式增长,2022年将达到3 200亿元[1]。

2020年3月4日中央召开会议,指出要加快包括5G网络和大数据中心等在内新型基础设施的建设进度。正式将5G等发力于科技端的基础设施建设提高到国家战略层面,驱动经济增长极。其中大数据中心领域是新基建中七大领域中的一个重要领域,也是其余高科技基础设施建设过程中重要的基础条件。对数据中心使用者来说,最关心的是其可用性,而对于建设者和运营者来说,建设成本和运营费用等是不得不直面的挑战。这就需要在新基建建设背景下,探讨一个适合当前中国数据中心的评估体系。

1 传统数据中心建设方式

1.1 国际评估体系

Uptime Institute成立于1993年,并在1995年提出Tier分类机房基础设施概念。TIA-942(2005)引用了其概念,逐步被全球用户广泛认知和接受,成为全球最知名的数据中心认证机构。其主要标准文件是评估数据中心的重要纲领性文件,仅提出目标等概念性内容,对具体措施不做具体要求,因此灵活性很强,可以通过不同的手段达到目标。

Uptime数据中心基础设施认证体系涉及设计认证、建造认证、永续运营认证以及M&O运维管理认证共4项认证,包括了前期设计、中期建造以及后期运营维护等数据中心的全过程,是完整而全面的评估体系。截至目前,全球已有超过85个国家和地区,1 000余个数据中心申请通过了Uptime认证[2]。4项认证的认证内容和认证依据如表1所示。

表1 4项认证的认证内容和认证依据

1.2 国内评估体系

国内数据中心评估体系比较知名的是中国质量认证中心(CQC)开展的数据中心认证。认证共分为4类,具体如表2所示。

表2 国内评估体系

CQC的场地基础设施认证主要与GB50174—2017《数据中心设计规范》相对应,信息系统机房动力和环境系统认证主要与GB50174—2017《数据中心设计规范》和JRT0131—2015《金融业信息系统机房动力系统规范》相对应,数据中心节能认证主要与GB/T 32910.3—2016《数据中心资源利用》第三部分相对应,数据中心基础设施运维评价项目主要与GB/T 33136—2016《信息技术服务数据中心服务能力成熟度模型》和GB/T 51314—2018《数据中心基础设施运行维护标准》规范相对应。这些国标或行标文件构成了CQC认证和评价数据中心的技术条文。

1.3 现有评估体系的优劣势

对比目前主流的两大认证体系,优劣势如表3所示。

表3 两大认证体系的优劣势对比

通过上述的比较可以看出,国内外的Uptime认证和CQC认证各有优势。由于指导理念、诞生环境以及发展路径的不同,两者的差异是比较明显的。Uptime认证依托于专业认证团队,采用目标达成为目的的认证方式,不拘泥于具体条文,兼具灵活性和原则性。而CQC方式依托于国内权威规范,操作性强且易于理解和实施,即使不进行认证,对设计、建造以及运营也具备很高的指导意义。相对的,他们的劣势也是比较明显的,共有的一点是相同等级内部的差异无法区分,原因在于等级的颗粒度比较大。

对比以上现有数据中心评估体系,本文尝试探讨一种新的评估体系,以便于数据中心相关人员能够快速掌握,并对相同等级内部不同差异的部分给与适当的评价和分析。

2 可靠性评估

2.1 拓扑分析

数据中心基础设施的可靠性评估可以说是数据中心评估体系中最重要的一环。传统的评估方式无论是以目标为导向的Uptime认证,还是以规范条文为导向的CQC认证,均是以拓扑分析为基础。对于实际系统来说,除包括具有串并联、n中取r以及旁联系统等典型结构外,还有组合而成的大型复杂系统,可以用可靠性框图分析法或网络系统分析法分析可靠性。

2.2 关键节点可靠性指标

关键节点可靠性指标可分为以下几个方面进行评估。首先是独立可靠性,累计失效概率、失效率、平均寿命以及可靠寿命。其次是维修性,包括平均修复时间、修复率以及维修度。最后是有效性,包括极限有效度、平均有效度以及瞬时有效度。

2.3 设备材料选型与测试

每个设备材料的选型与测试都可以为网络系统分析中的节点或弧进行赋权。由于初始数据不完备,因此可以利用贝叶斯方法测算并修正。

3 节能环保评估

3.1 指标分析

节能环保的参数包括PUE、单功耗占地指标、单功耗耗能指标以及单功耗用水指标等。在评估过程中,一方面需要注意不同单机架功率条件下的指标差异。单机架功耗越大,相应的单功耗指标越小,而单机架指标越大,与功率密度相一致。另一方面需要注意的是不同技术路线所产生节能指标的差异。例如,冷冻水主机的消耗包含了电能的消耗和水资源的消耗,间接蒸发冷却技术合适于缺水和干燥地区,减少了大量水资源的消耗,但其技术要求环境的匹配性更高,因此评估其是否合理也是评价指标的重点。

3.2 全过程分析

目前,节能环保不仅仅是作为建设过程中的考核指标,也是运营过程中需要面对的问题。如果在方案选取伊始就能够因地制宜地选择合理的节能环保措施和产品,那么在运营过程中可以减少大量开支以及人力和物力的消耗。相关的产品和技术对运营本身有着巨大影响。此外,在看不见的生产和后期维护、更新、淘汰以及报废等过程中,对于节能环保的全过程要求,也应该纳入节能环保评估的框架内。

4 运营服务评估

运营服务重点评估人员管理、维护要求与过程以及文件管理等。其中,在人员管理方面,评估组织架构、人员配置、任务分配、资格评定、培训计划以及岗位职责等。在维护要求及过程中,评估维护计划、对接流程、紧急事态管理、质量管理考核、资产管理、工器具保养与更新、备品备件管理、供应商管理、故障分析以及预防性计划等。在文件管理方面,评估档案库、竣工图、各类报告、标准流程、政策文件以及流程文件等。

5 结 论

建立的新评估体系更契合国内建设、运营以及使用的实际情况。本文不但提出了评估的原则,也提出了评估的具体内容和做法,能够为建设者和产业链上的各个生态角色提供有实际操作的指导方法。此外,其能精细化同等级数据中心的差别。每个数据中心都不同,配置的多少和选材的好坏都会影响数据中心的评价。因此需要不断合理利用新评估体系,以满足各方面的实际需求。

猜你喜欢
功耗数据中心可靠性
基于任务映射的暗硅芯片功耗预算方法
浅析数据中心空调节能发展趋势
关于建立“格萨尔文献数据中心”的初步构想
合理使用及正确测试以提升DC/DC变换器可靠性
GO-FLOW法在飞机EHA可靠性分析中的应用
2017第十届中国数据中心大会榜单
5G通信中数据传输的可靠性分析
论如何提高电子自动化控制设备的可靠性
揭开GPU功耗的面纱
数字电路功耗的分析及优化