疫情之下 远程运维首重安全

2020-12-30 11:59本刊编辑部
网络安全和信息化 2020年4期
关键词:运维远程方案

2020年春节本该是一片祥和喜庆的景象,但新冠肺炎疫情猝不及防给整个社会来了一场“实战”检验。检验结果有目共睹,方方面面的优劣强弱,在疫情面前暴露无遗。

抗“疫”期间,网络技术与大数据的全面运用充分体现了其社会价值。而在互联网大数据时代,数据中心是其中的重要载体,保障数据中心的安全稳定运行是运维人员的重点工作。

IT系统能否正常运行直接关系到业务或生产是否能够正常进行。但IT管理人员经常面临的问题是:网络变慢、设备发生故障、应用系统运行效率很低。IT系统的任何故障如果没有及时得到妥善处理都将会产生很大的影响,甚至会造成巨大的经济损失。

由于新冠肺炎疫情的原因,国家延长了春节假期,各地也相继出台了复工时间表,复工时间推迟对于企业来讲无疑是一个重大打击,业务会受到严重影响。为了将损失降到最低,不少企业纷纷开启远程办公模式,这对IT基础架构设备的稳定性提出了更高的要求。

为了保障IT系统的稳定运行,需要很多基础IT设施的支撑,包括底层数据库、业务系统、服务器等。在疫情期间,对于这些基础服务器的管理和运维,成了IT运维人员重要的日常任务。配置更改、系统调试等都需要依赖于运维人员来完成,远程运维成为了主要的运维方式,如何保障运维人员顺利且安全地完成数据中心的日常运维操作,是IT部门面临的重要问题。

IT运维人员需要面对巨大的运维压力,是否可以在家办公,随时掌握企业IT设备的运行状态?经历过这次疫情,很多互联网从业人士,纷纷预测“远程办公”将会是下一个风口。那么身为IT运维人,我们肯定会问,运维领域的下一个风口会是远程运维么?

采用远程运维有何好处?当然是让运维人员更方便,能够随时随地进行运维工作,而不必天天守在机房待命。远程运维的好处有两点:一是操作上的便利,能够以最快的速度实施远程维护,二是远程运维较少受外界因素的限制(比如地理位置、软硬件设备等),可以随时随地进行运维。选择方便的远程运维方案,不仅提高了工作效率,而且保证了充足的休息时间。

但并不是所有的公司都支持远程运维,很多人认为,远程运维使得数据中心的安全性降低。安全是数据中心非常重要的考虑因素,所以很多公司往往将远程的端口关闭,只采用本地运维的方式,只有在需要的时候才会考虑开通。

但是随着手机、平板、笔记本等移动设备的普及,当然还有人们不断追求的工作舒适性的需求,越来越多的公司开始支持远程运维。

疫情对企业IT运维的影响

疫情影响下,所有企业IT运维不可避免地会受到各种影响,主要表现在以下几个方面。

1.现场运维力量缺乏

为了防止疫情蔓延,响应政府号延迟复工,企业纷纷采用远程办公,以最小化的标准严格限制到场人员。因此,对于企业IT运维来说,现场运维力量的大幅减弱,导致系统健康性巡检、业务需求响应、变更执行和故障应急等现场工作的响应及时率和完成度受到了较大影响。

2.系统安全可控性难度加大

随着疫情爆发,受限于远程,企业信息安全管理工作的开展难度和效率低下将对系统安全性产生一定影响。

3.业务宕机风险增大

疫情影响下开展远程办公,针对故障的各个处理环节(例如:故障响应、故障处理和硬件维护等)将出现或多或少的延迟,对于业务系统来说,无疑增加了业务长时间宕机的风险。

4.重点专项工作延迟风险高

疫情影响下,无法保障重点工作沟通的有效性和时效性,因此,涉及资源申请、变更审批和实施等项目工作,将无法有效开展,很可能导致各类重点工作的进度延迟,从而对核心业务形成至关重要的影响。

疫情下企业对IT运维的普遍需求

即便影响因素受制于客观条件较难短期克服,但是企业仍然对IT运维人员提出以下几点要求。

1.人员投入可以减少,但运维效率不能降低

如上所述,疫情影响下,现场运维人员投入的被动减少是必然的。那么,在远程运维背景下,保障运维效率最小程度的降低,甚至不降低,是企业对于IT运维的第一需求。

2.人员可以不在场,但系统安全必须始终在线

企业信息安全管理工作必须保持较高的响应及时率和整改时效性。

3.运维可以远程,但故障响应必须及时

业务系统的稳定运维是企业正常运作的必要前提,因此,防疫期间对于系统故障的支持力度必须得到最大程度的保障。

4.复工可以延缓,但重点工作进度不能延迟

基于远程办公的背景,如何提升重点工作的沟通效率,保证项目资源申请、变更审批和实施等工作能够高效开展,是IT运维需要重点解决的问题。

从2020年2月中旬起,IT行业内的巨头公司,纷纷推出远程运维服务或者相应的运维产品,产品各有特色,卖点也不尽相同。但归结到最终,都是要满足用户的真实需求,从用户角度出发研制的产品,才是真正的好产品。

疫情之下远程运维首重安全

2月25日,微盟集团发布的一则公告引起舆论热议。微盟的生产环境及数据遭遇其员工人为“恶意破坏”,该员工通过个人VPN登入公司内网跳板机,因个人精神、生活等原因,对微盟线上生产系统环境进行了大肆破坏,造成生产环境服务器出现故障,大量用户数据被删除。此次事件最直观的影响表现:2月24日至2月25日10点整,微盟集团市值约蒸发12.53亿港元;带给微盟客户的损失不可估量,微盟准备1.5亿元赔付拨备金进行赔偿。

因内部员工恶意破坏企业内部生产系统而造成重大事故,听起来很“不可思议”,但此类事件,并非首次发生。为何事故一再发生?又该如何保护企业核心数据,让运维更可控、更安全?特别是在当前疫情特殊时期,国内企业纷纷开启远程办公模式,安全运维也不得不“远程”。

远程运维作为一种经过业界验证的成熟方法,可以提升生产系统运维的便利性和及时性。但远程运维将信息化资源和运维操作暴露在互联网之中,存在数据泄露、通讯安全、未授权访问和木马病毒侵害等安全问题,应将安全性作为远程运维产品选型的首要考虑因素。因此,提出以下几点建议。

一是统筹规划、分步实施。远程运维最大的风险就在于安全性,但安全方案绝非一劳永逸,而需要建立安全体系并持续完善。因此,远程运维方案需要统筹规划,充分考虑技术方案的特点、适用的时点和管理的难点。

二是用好存量、选好增量。通过多年的建设,大多数企业已部署和使用了较多的成熟安全产品,如VPN、动态令牌和堡垒机等,特别是建立了与之匹配的相关规范。合理使用和完善现有方案,既能缩短实施周期,又能降低资金和使用成本。在新产品的选择上,尽量与现有技术产品相兼容,确保远程运维方案的延续性。

三是明确场景、完善流程。远程运维方案的难点在于处理好便利与安全的平衡,其重点在于因地制宜地制定好相应的制度流程。通过适用场景、授权、登记和审计等规范和流程的建立,来确保远程运维的规范性和安全性。

根据上述分析,结合当前疫情防控情况,建议远程运维方案的建设可以分为三个阶段。

第一阶段是疫情防控的特殊期,充分利用现有技术,快速具备远程运维条件,建立配套规范,从技术和管理上双管齐下平衡好便利与安全的关系。一是建议新建应急方案。可以采用“VPN+堡垒机”方式,快速搭建远程运维渠道。在疫情防控的特殊时期,要充分利用现有安全体系和产品,如堡垒机现有用户权限、身份认证、操作记录和安全审计等功能,来提高技术方案的安全性;二是建议完善应急远程运维相关机制,明确适用人员和场景,规范授权、使用、登记和审计,通过制度来管理和提高远程运维的安全性和合规性。

第二阶段是疫情过后的过渡期,进一步加强互联网防护技术能力,进一步提高安全性。新建远程运维专用VPN或将中转机放置于互联网防控区,通过专用网络安全产品,对远程运维方案进行安全加固。同时,在过渡期对业界成熟方案和产品进行测试和论证,制定更为成熟的远程运维方案。

第三阶段是成熟方案的建设期。结合实际情况,选择适用的成熟远程运维技术方案和产品,建设一套更为安全、可靠和高效的远程运维平台,同时不断健全相关制度流程,切实提高远程运维能力。

2020年的这场新冠肺炎疫情必将对于我们的生活模式和企业运作模式产生深远的影响。

猜你喜欢
运维远程方案
烂脸了急救方案
高速公路智能运维平台
远程求助
远程工作狂综合征
智能+时代的新运维
——2019(第十届)IT 运维大会特别报道
远程诈骗
定边:一份群众满意的“脱贫答卷” 一种提供借鉴的“扶贫方案”
配电线路的运维管理探讨
电子政务甲方运维管理的全生命周期
稳中取胜