基于EVC的企业服务器高可用群集实践

2019-12-17 08:10叶继强
科技视界 2019年33期

叶继强

【摘 要】本文通过分析在企业有关于混用新旧服务器配置高可用群集的问题,通过采用VMware EVC技术解决这类问题的途径,并描述了在中核苏阀科技实业股份有限公司(以下简称“公司”)案例中应用虚拟化平台技术构建服务器高可用群集(HA)的过程,研究合理的服务虚拟化应用平台构架。通过实践证明,基于VMware EVC技术能将新旧服务器组成群集,计算资源得以共享,使虚拟机应用服务可以进行故障自动迁移,提高了服务器的使用率和稳定性,降低了公司在服务器设备资金的投入成本和管理成本。

【关键词】服务器高可用群集;虚拟化技术;VMware EVC

中图分类号: TP302文献标识码: A 文章编号: 2095-2457(2019)33-0011-002

DOI:10.19694/j.cnki.issn2095-2457.2019.33.005

0 引言

随着企业的不断扩大,企业服务器数量也越来越多。大多服务器只运行一个系统应用,公司采用虚拟化技术很好的解决服务器计算资源闲置的问题,为了使服务器计算资源能够互通共享,就需要配置服务器高可用群集。

中核苏阀科技实业股份有限公司(以下简称“公司”)信息中心现有信息化建设起步较早,公司的信息化应用系统分布在不同的物理服务器上,数据环境基本按照“一台服务器、一个操作系统、一种应用”的模式不断搭建扩展。公司信息中心机房现有物理服务器数量三十余台,但由于服务器建设周期不同,服务器新旧程度存在差异,服务器CPU也有不同平台等级的问题,对配置服务器高可用群集带来困难。通过配置增强型vMotion兼容性 (Enhanced vMotion Compatibility,EVC)功能确保群集内服务器的兼容性,可以解决新旧服务器混用问题。

1 需求分析与方案设计

公司的虚拟化平台搭建的是VMware vSphere平台,服务器搭载的是ESXi6.0u3版本系统;计算资源方面,服务器品牌均为HPE服务器,但服务器系列跨度较大,从GEN7至GEN10各个系列的新旧服务器混用;存储方面,公司使用万兆网络连接存储聚合与数据群集,为服务器群集高可用提供基础。原服务器群集使用VCSA进行统一管理,虽然应用数据都与计算资源服务器分离,但由于服务器兼容性问题,无法使用在线迁移功能,计算资源故障后也无法自动迁移至可用服务器上。

由于VMware vSphere平台虚拟硬件规格对于启用高可用群集的CPU有兼容性要求,本次重新构建了一个以3台ESXi6.5U2的主机的群集并新建vCenter进行管理。VMware EVC具有多种模式,不同的模式所提供的功能有所不同,由服务器硬件规格差异所支持的模式也有所不同,当具有不同EVC模式支持的主機,创建成同一个群集时,其EVC选型支持以最小的一台主机的最后一项为准。

群集必须最低具有三台ESXi主机,本次挑选了2台HPE DL380 GEN10和1台DL580 GEN9的服务器进行构建群集。虽然服务器CPU型号不同,但所支持的EVC模式是基本相同的:

新建的服务器群集不对公司原有网络环境产生改变,连接公司原有万兆存储网络并挂载存储聚合卷,3台服务器分别连接公司核心网络交换机与灾备网络交换机,完成群集网络组建。

在不影响各个应用服务连续性和终端环境稳定性的前提下,使用VEEAM灾备系统对公司OA应用、ERP应用、视频会议系统原有系统进行全环境备份,并直接恢复至新的虚拟群集中;在新群集上新建备用域及DNS服务器,使全新安装的虚拟机环境能在域环境故障情况下具有一定的容错能力。

2 服务器高可用群集EVC配置实践过程

VMware的高可用必须先创建一个群集,然后用主机填充该群集,并在建立故障切换保护之前配置EVC设置。群集构建的基础是vSphere和vCenter Server的搭建。为3台服务器安装相同版本的EXSi6.5U2后,选取第一台搭建VCSA至服务器本地磁盘上后,确定群集的节点,配置节点的网络连接并挂载共享存储。

根据公司原核心网络VLAN的划分,为3台服务器分配配置三个虚拟交换机,一个作为生产网络、一个作为虚拟机动态迁移vMotion网络、另一个作为备份网络。通过连接万兆网络添加两个存储聚合卷,完成服务器高可用群集的底层要求。在建立好网络架构后,将3台服务器添加到群集并完成高可用配置。

按EVC设置规则,不同型号的主机按所支持的EVC模式的最后一项为准,在群集配置中选择为Intel 主机启用EVC,并将VMware EVC模式选为Intel "Broadwell"Generation模式,此模式可提供事务性同步扩展、监控模式访问防护、多精度带进位加指令扩展、PREFETCHW和RDSEED等CPU功能,缺点是只支持同等级或更高CPU规格的服务器加入群集。在开启了EVC后配置开启vSphere HA,在出现服务器故障下自动重新启动虚拟机应用服务,并设置预留一定比例的群集资源来定义故障切换容量。

在完成了群集的基础搭建后,通过vCenter对群集的计算资源进行整合,并为要迁移的虚拟机应用系统预估划分计算容量和空间容量。通过不同的迁移方式,将虚拟机迁移至群集上:

通过使用公司VEEAM灾备系统,将原有虚拟机系统环境、应用服务、数据全部备份并封装成独立的备份单元,在群集上直接将备份单元恢复至虚拟环境里来。完成整体环境恢复后,恢复网络服务并测试应用功能。

在群集上新建备用域与DNS服务器,并为群集上的虚拟机配置可切换的备用地址,断开群集与主域之间的网络连接,测试备用域与DNS的可用性。

公司视频会议系统验证使用的是USB电子狗,由于该USB设备无法进行自动迁移,需在群集上为虚拟机与主机之前建立反向规则,将视频会议应用虚拟机绑定至规定的主机,使其不进行自动故障迁移。

服务器高可用群集配置全部完成后,对群集故障迁移能力进行测试,关闭群集中任意一台主机,群集检测到主机故障并自动对虚拟机进行了计算资源迁移,应用服务完全不受虚拟机的在线迁移影响,做到客户端无感知故障自动迁移。而视频会议应用由于虚拟机规则的设置,没有进行自动迁移。

4 效益分析

通过服务器高可用群集EVC配置,有效地发挥了公司虚拟化平台,使新旧服务器可以混用在同一群集中,大幅提高了旧服务器的利用率,有效遏制了物理服务器数量的增长。

减少了物理服务器的采购数量,如不使用EVC技术,那每次服务器购置就必须按群集主机基数进行采购,现在按需对服务器数量进行更新,对中小型机房的服务器采购节省了大量更新设备的经费,同时也延长了老服务器的可用时间。

利用服务器高可用群集,实现了服务器之间的动态资源调配和高可用功能,可使群集有能力进行主机故障自动迁移虚拟机应用服务,保证了应用系统业务的连续性。

通过配置EVC技术,成功将原有3台新旧混搭的物理服务器构建成一个高可用群集,虚拟化应用效果较好。通过服务器虚拟化群集整合,既满足了公司应用系统稳定运行的需求,又有效控制了公司服务器设备购置和管理的成本。