AI 赋能运维新时代
——2020(第十一届)IT 运维大会特别报道

2020-11-13 05:10本刊编辑部
网络安全和信息化 2020年11期
关键词:数据中心运维解决方案

■ 本刊编辑部

随着数据中心等新型基础设施的加快建设,驱动各行业的数字化转型升级,与新基建相匹配的IT 运维能力成为新基建能否发挥效能的关键因素。面对新基建,IT 运维正在加快变革,迎接未来的挑战。包括云计算、大数据、人工智能等在内的新一代信息技术快速发展,让IT 运维正从原来的被动式、应急式逐步向主动式、智能化运维升级。

为推动智能化运维的应用实践,10 月21 日,《网络安全和信息化》杂志社和IT运维网共同举办“2020(第十一届)IT 运维大会”,以“AI 赋能运维新时代”为主题,分享业内最佳实践,促进企业和用户交流,帮助企业用户快速转型,加快实现智能运维在企业的真正落地。

共聚一堂为智能运维发展建言献策

当今社会信息发达,企业信息化建设快速发展,随着企业规模不断壮大,信息系统规模和复杂程度不断上升,各个行业领域纷纷加大对信息技术的投资。信息系统的优劣直接影响了企业竞争力的强弱,传统产业利用互联网实现业务的在线化和数字化,进一步提升了信息系统在企业中的价值,而信息系统的稳定可靠运行关乎企业的业务发展,给IT 运维工作带来极大的挑战。同时,随着数据中心等新型基础设施的加快建设,驱动各行业的数字化转型升级,与新基建相匹配的IT 运维能力成为新基建能否发挥效能的关键因素。面对新基建,IT 运维正在加快变革,迎接未来的挑战。包括云计算、大数据、人工智能等在内的新一代信息技术快速发展,让IT运维正从原来的被动式、应急式逐步向主动式、智能化运维升级。

智能运维(AlOps)概念最早由Gartner 提出,它是将人工智能科技融入运维系统中,以大数据和机器学习为基础,从多种数据源中采集海量数据(包括日志、业务数据、系统数据等)进行实时或离线分析,通过主动性、人性化和动态可视化,增强传统运维的能力。

尽管智能运维是运维领域最新技术,其应用的人工智能产业目前也是朝阳产业,在技术成熟度上仍有待提升,但并不妨碍智能运维所产生的强大生产力。

Gartner 预测,至2022年,大型企业中的50%将会部署AlOps 平台,进行数字化转型。许多企业将会利用AlOps 进行业务运营和IT 运维,取代如今的运维工具。

在刚刚举办的“2020(第十一届)IT 运维大会”上,来自企业、用户的专家代表分享了各自在智能运维领域的探索与实践。

运维人员每天要面对的工作繁琐又重复枯燥,北塔软件技术总监魏玉雄认为,学习、认知、决策、执行是人工智能的核心要素。北塔智慧运维解决方案无需人工干预,通过自动学习,系统智能创建符合用户环境的被管对象的“健康基线标准”。对于超大规模的用户,认知可以从海量数据中通过机器学习出来;对大多数数据量较少的用户而言,不必舍近求远,北塔智慧运维解决方案提供智维分析中心模块,将企业的用户经验转化为分析方案,让运维工作不再强依赖于个人,不仅提高了运维效率,更是让运维人员获得了更多自由。

受新冠肺炎疫情影响,企业纷纷加快了数字化转型的步伐,卓豪ManageEngineIT管理专家吴兆勇分享了多年来卓豪ManageEngine 在IT运维管理领域的研究成果。人工智能参与到IT 运维中来,可以应用机器学习、大数据分析等方法实现自动化的性能瓶颈发现和事件模式分析,探索问题的根本原因。

云计算及物联网时代的到来,使得IT 监控运维的高要求与低成本之间的矛盾日益突出,IT 运维正面临着监控要求高、工具成本高、运维人员少等行业痛点。美信科技COO 程永红从行业痛点出发,分享了美信科技一体化综合监控平台——监控易,该平台最大的特色就是全国产化,完全自主产权。

当前,海量IT 设施、分布式成为大型运维平台架构的主流,很多大型企业的服务器数量由千级别向万、十万级别迈进。在这种形势下,传统的点对点监控技术已经不能满足需求,IT 运维必须向智能化、自动化提升。东华网智高级顾问曹华分享了东华AIOps 运维解决方案,将大数据技术、机器学习技术、自动化作业技术应用于运维领域,围绕质量保障、成本管理和效率提升三方面构建智能运维场景。

随着企业数字化转型的加快,数据正在呈指数级增加并逐渐汇入数据中心,服务器的数量也在快速增长,数据中心的不断扩大给IT运维带来极大的挑战。据英特尔解决方案架构师解强介绍,英特尔DCM 是一款带外软件解决方案,用于监控和管理服务器和其他IT 设备的功耗、温度、资产、利用率和健康状况,利用人工智能技术,帮助企业IT 运维人员实现数据中心的智能化运维。

网络涉及范围广、设备种类多、用户数量大是现今网络的三个基本特点。一个中型网络,设备数量经常多达几千台,但基本采用人工分散的管理方式,这些传统方式不仅浪费大量的人力物力,而且远不能适应当前状态下实际网络应用与IT 运维的需要。针对各行业面临的IT 集中管控需求,豪越科技创新服务事业部总监侯方表示,豪越HYDO 智能运维大数据管理平台基于深层自动拓扑及流量安全监控、ITSM+CMDB+ITOM 和人工智能等技术,可以明显增强信息化管控能力,提高经营管理水平,加强信息化运营,为各行业业务战略提供良好支撑。

目前,我国在信息化基础建设方面取得了举世瞩目的成绩。信息化基础建设初级阶段的完成,使企业对运维服务的需求急剧提升。但由于整个市场缺乏统一标准与规范,用户无法明确传递服务需求,亦不能清晰衡量定义服务价值和质量,而服务商方面则良莠不齐,这对我国的IT 服务产业的发展产生了制约。因此,国家出台IT 信息技术服务标准势在必行。赛迪检测认证中心有限公司副总经理刘闯分享了一些目前我国信息技术服务标准研制的情况,以及在信息技术应用创新领域,与IT 运维相关的标准的推进情况。

由IT 运维网和《网络安全和信息化》杂志社共同组织策划的“2020 智能运维星耀榜”也已正式公布。“2020智能运维星耀榜”共设置“最具影响力企业TOP10”与“产品/解决方案TOP10”两大榜单。

此次榜单聚焦IT 运维领域,展现运维厂商在智能运维领域的实力与风采,介绍优秀的智能运维产品和解决方案,支持企业的数字化转型,助力新基建。本期专题将介绍部分入榜企业及优秀产品/解决方案。

2020智能运维星耀榜

《网络安全和信息化》杂志和IT 运维网共同推出“2020 智能运维星耀榜”,共设置“最具影响力企业TOP10”与“产品/解决方案TOP10”两大榜单,经过本刊编辑部与相关专家评选以及网络投票等环节,并参考技术创新能力、市场领导力、用户满意度、发展潜力四大维度进行综合评估,得出最终结果,现将两大榜单予以公布。

最具影响力企业TOP10

北京中亦安图科技股份有限公司

卓豪(中国)技术有限公司

北京金支点技术服务有限公司

北京智和信通技术有限公司

国网冀北信通公司

阿里云计算有限公司

腾讯云计算(北京)有限责任公司

华为软件技术有限公司

维谛技术有限公司

新华三技术有限公司

产品/解决方案TOP10

Intel DCM 数据中心管理解决方案

亦维灾备自动化管理系统(EVO-DR)

北塔软件智慧铁路运维管理解决方案

豪越HYDO 智能运维大数据管理平台

美信科技 全国产高性能一体化集中监控平台

甜橙金融 云原生网络流量分析监控平台

东华AIOps 运维解决方案

ATEN 数据中心智能化运维解决方案

神州泰岳全栈智能监控产品

太极数据中心EPC 总承包解决方案

(以上榜单内容排序不分先后)

英特尔助力智能数据中心运维

随着“新基建”的落地实施,数据中心作为重点发展的领域,其建设与运维的发展趋势,最新技术正在受到企业级的关注。越来越多的企业选择拥抱云计算。在云化转型之路上,选择架构灵活、减少业务成本的代价就是运维复杂程度大大增加,给运维人员提出了巨大的挑战。

英特尔解决方案架构师解强介绍说,数据中心运维面临的主要挑战就是数据中心效率与成本的协调问题。解强举列了一些实际工作中遇到的问题。比如,人工的服务器巡检费时费力,还无法及时反映服务器健康状况;北京的数据中心有一台服务器出了故障,我在上海无法登录更无法诊断;数据中心服务器太多,有没有什么方法,能通过一台电脑就可以实现对整个数据中心的管理和检测等等。

要想回答这一系列数据中心运维的难题,企业需要在运维中加入一大利器——人工智能。智能运维可以让数据中心运维既保障高质量与高效率,又可以保持较低的运营成本,完美解决了困扰企业的难题。

英特尔解决方案架构师 解强

解强分享了英特尔在智能数据中心运维上积累多年的经验。解强认为Intel DCM 系统架构是通向数据中心优化及敏捷管理之路上的绝佳伴侣。

Intel DCM 是一款带外软件解决方案,用于监控和管理服务器和其他IT 设备的功耗、温度、资产、利用率和健康状况。Intel DCM 通过以下方式降低数据中心总体拥有成本(TCO):改善库存和资产管理;增加数据中心可靠性;简化维护;优化功耗管理和散热效率;提升机柜密度;缩短停机时间。

Intel DCM 可以将IT 设备能耗可视化,打破异构的鸿沟。一方面,使用无托盘程序监测所有主流厂商服务器,通过服务器板载BMC进行数据监测,无需任何额外硬件;软件客户端无须安装托盘程序,使用浏览器进行监测;超过上百类主流服务器厂商型号兼容,并随着英特尔新平台不断扩展,服务器厂商未来将进行DCM 认证。

另一方面,进行功耗状态及温度的持续、可视化监测。主要进行以下方面的监测:机房、机柜、设备级查看;功耗监测与告警;温度监测与告警;图表分析及报告。

此外,Intel DCM 可以有效提升机柜密度,以延长数据中心寿命。解强表示,透过监测某IPDC 数据中心,利用Energy Director 的监测及能耗控制功能,机柜密度可以提升30%以上。

由于在数据中心运维领域的优异表现,Intel DCM数据中心管理解决方案荣获“2020 智能运维星耀榜产品/解决方案TOP10”。

ManageEngine 实现高效运维

随着人工智能的发展,传统的人工运维模式逐渐被替代,将人工智能技术与IT 运维相结合,成为运维领域的新模式。不久前,Gartner 公布了2021 年重要战略里指出,人工智能工程化和超级自动化是两项重大趋势。为了将人工智能转化为生产力,就必须转向人工智能工程化这门专注于各种人工智能操作化和决策模型(例如机器学习或知识图)治理与生命周期管理的学科。人工智能工程化立足于三大核心支柱:数据运维、模型运维和开发运维。可见,智能运维是每一个企业都必须经历的转型,否则就会落在时代之后。

在运维领域,卓豪集团一直专注企业IT 服务,旗下产品ManageEngine 是专业研发和销售IT 管理软件的优秀品牌,产品经过20 年的技术沉淀和不断创新,逐步改变了企业级IT 运维的理念和方法。ManageEngine 为客户提供简便易用、高性价比、完整的IT 运维管理解决方案。产品线涵盖:网络管理、应用监控、流量分析、日志审核、桌面管理、域管理、IT 服务管理等IT 运维中所涉及的各个领域,客户可根据自己的需求,选择合适的产品、从而为客户提供适合的解决方案。

卓豪ManageEngine IT 管理专家 吴兆勇

其中ManageEngine EventL og Analyzer(日志分析仪)是卓豪集团的主打产品之一,它是适用于SIEM 的日志管理软件,是基于Web 的日志分析报表解决方案。它内置Syslog 服务器用于收集日志,并使用高效的分析引擎,对存储的日志进行分析、解析,并通过专门的报表工具生成报表。它可以对来自企业和组织中的所有IT 资源(包括网络、系统和应用)产生的安全信息(包括日志、告警等)进行统一的实时监控、历史分析,对来自外部的入侵和内部的违规、误操作行为进行监控、审计分析、调查取证、出具各种报表报告,实现IT 资源合规性管理的目标,同时提升企业和组织的安全运营、威胁管理和应急响应能力。

其优势是对比同类产品,可对安全软件(如360 软件)进行日志审计,有6 亿以上的恶意IP 库;支持面广,可审计多种脚本,审核厂商定制场景。ManageEngine EventLog Analyzer 自问世以来,广受用户好评,屡获殊荣。被认为是SIEM 中最具性价比的软件。

由于在业界具备良好的口碑,卓豪入选“2020 智能运维星耀榜最具影响力企业TOP10”。

本次大会上,主办方还特别邀请到卓豪ManageEngine IT 管理专家吴兆勇在现场为与会嘉宾分享卓豪在IT 运维领域多年来的研究成果,并分析了如何以人工智能技术来突破自动化的性能瓶颈与事件模式分析等。

智和信通打造智能运维新模式

5G、人工智能等技术的迅猛发展促进了各领域数字化和智能化的步伐,也给企业运维带来了不小的挑战。网络设备不断更新叠加,其复杂程度越来越高,对于运维人员来说,传统的运维方式已经无法满足企业的需求。所以,企业必须借助自动化、智能化运维快速准确地发现问题并处理。

北京智和信通技术有限公司专业从事网络管理运维、IT 综合监控、网络管理平台、国产化安全软件、安全管控平台的自主研发和销售服务,以践行自主创新、助力安全可控为己任,致力于为客户提供技术领先的网络管理与安全解决方案,帮助用户提升网络和IT 的价值。

为了大幅提升企业运维效果,北京智和信通自主研发了AIOps 综合运维平台——智和网管平台SugarNMS,采用“国产安全+监控+分析+安管+运维+日志+开发平台”创新七合一模式,解决用户IT 网络设备、应用及软件服务综合管控、功能实现、运营维护和拓展集成的难题。

智和网管平台采用全Java 技术,可在Windows、Linux、Unix 等系统之上运行使用。采用设备统一接入模型及机器学习算法,实现网络设备、传输设备、计算机、服务器、虚拟化、中间件、数据库、工业物联设备、应用及服务的一体化监控运维。

该平台已实现1000 种基础网管功能,如一键自动发现、拓扑管理、设备管理、资源管理、链路管理、故障管理、安全管控、性能管理、事件管理、配置管理、统计报表、日志管理、安全审计、资产管理、网络工具管理、工单运维等功能,平台还支持自主扩展、无限开发新功能。

平台具备C/S 和B/S 两种客户端界面,通过PC 或移动设备掌控远程运维。支持集中式和分布式部署;分布式环境下支持部署多套采集代理网关。采集代理网关支持SNMP、Telnet、SSH、WMI、Syslog、JMX、JDBC/ODBC、TCP/UDP、IPMI、ICMP、Netconf、GRPC、ONVIF、HTTP等网管协议;采集代理网关可私网穿透对设备监控,不需要第三方NAT、代理软件或硬件。支持万级局端同步管理,秒级监控,双机热备,运行稳定。

智和网管平台行业涉及军工国防、科研院所、政企、金融、交通、能源、电信、广电、公共事业、教育、医疗等领域,覆盖全国30 多个省。平台适用新基建运维,如铁路和轨道交通、5G 及微波通信、卫星导航、工业物联、数据中心等领域的网络监控。目前已应用于中船重工、航天科工、中国电科、国家互联网应急中心、中国信通院、电力科学研究院、武警森林指挥部、国家海洋局、水利局、税务局、政府等单位。

北京智和信通在运维行业拥有十余年经验,始终坚持自主创新产品及安全解决方案,据统计在各行各业,已管控800 万台设备,成功服务于500 家单位,凭借业内良好的口碑,入选“2020 智能运维星耀榜最具影响力企业TOP10”。

国网数据中心的自动化运维实践

随着信息化建设的全面深入开展,电力企业数据中心的规模越来越大,运维管理也越来越复杂。在数据中心的建设中,面临着资源利用率低、高能耗、高管理成本等问题。

国网冀北电力有限公司信息通信分公司(以下简称“信通公司”)隶属国网冀北电力有限公司,成立于2012年,2019 年4 月份加挂“数据中心”牌子,主要承担冀北公司信息通信系统的项目建设、调度监控、运维管理、安全管控、客户服务以及数据管理、能源互联网技术支撑职责。由于独特的地理区位和历史沿革,信通公司还承担着国网公司及华北分部的通信系统属地建设、运行维护和业务保障工作。

信通公司设置办公室、财务资产部、安全监察质量部、技术发展部、党委组织部、党委党建部6 个管理部门和信息通信调度监控中心、通信建设运维中心、平台运行及安全中心、数据技术中心4个业务机构。公司是一个拥有一支学历层次较高、基础素质较好、年轻有活力的互联网支撑队伍。

在冀北公司党委的坚强领导下,信通公司全体员工励精图治、开拓进取,全面加强支撑能力建设,努力提高管理水平。经过近几年的努力,信通公司逐步完成冀北公司基础网络、业务系统的再造和重构,通信网络和信息化系统实现独立运行,正在向完善提升、创新引领的新阶段迈进。在通信方面,建设并运行35 千伏及以上骨干通信网光缆5.3 万公里、通信设备1.3 万台(套),形成了“省地万兆、地县千兆”的“大枢纽、大带宽、一体化”通信网络,实现变电站、供电所和营业厅全覆盖。信通公司直接管理的三级骨干通信网共16 套系统1632 台设备,承载了冀北调度范围内保护安控业务通道864 条、其他生产业务通道4218 条、管理业务通道320 条。信息通信调度实现同质化运行和集约化管理,连续两年获评国网四星级信通调度,186 客服达到国网三星级水平。在信息方面,建成一级网络带宽10G、二三级网络千兆的三级信息网,实现冀北区域办公、生产、营业场所信息网络全覆盖。

英特尔DCM 是一款带外软件解决方案,用于监控和管理服务器和其他IT 设备的功耗、温度、资产、利用率和健康状况,利用人工智能技术,帮助企业IT 运维人员实现数据中心的智能化运维。

信通公司通过英特尔DCM 数据中心带外管理方案、机房动环自动化系统、云网可视化微服务全路径流量展示等自动化运维系统,实现了对国网云的自动化运维支持,为电力物联网体系做出了有效支撑。

在“2020(第十一届)IT运维大会”上,国网冀北信通公司入选“2020 智能运维星耀榜最具影响力企业TOP10”。

金支点提供高质量运维服务

随着经济发展,越来越多的行业渴望具备高实时业务能力,来满足他们在实时绩效管理、快速财务结算、高效应收账款管理、实时供应链管理、大数据应用、快速市场洞察等诸多方面的迫切需求。

北京金支点技术服务有限公司(GPOS)是从事IT 环境运维与资源池服务的国内自主品牌服务与方案供应商。公司协助百余家大中型机构进行有效IT 治理、达成IT 运营目标。公司成立于2005 年,总部位于北京,并在全国各主要经济区域设有分支机构。在上海、西安、深圳、沈阳、成都、武汉、南昌、昆明、南宁、福州、呼和浩特设有分公司或办事处。

公司拥有多支具备跨平台综合服务队伍,具备研发、测试、咨询与服务能力,针对各种主流软、硬件系统和老旧型号系统提供强有力的运营支持。公司多名员工毕业于铁路、国防、石油高等院校,有着丰富的行业知识及实践经验,为做好行业服务打下了良好的基础。

公司自成立以来,积累了丰富的IT 服务经验,并提炼形成了标准的管理体系与贴合客户需求的多层次的定制化IT 服务解决方案,致力于向用户提供专业、可靠的第三方IT 服务,包括IT 维保、专业IT 支持和IT 咨询、培训,推动客户IT 系统运营的完善。

多年来,金支点与铁路、电力、电信、石油、政府等多个行业保持着长期友好合作。金支点凭借自身在该领域的积累,既能为企业提供合宜的系统方案建议、原厂渠道,也能提供稳固的系统运维支持。

金支点先后承担过铁道部TMIS、DMIS、PMIS、TDCS、统计工厂、财务等关键业务系统的建设与维护,在电信计费、电力调度、石油高性能计算等应用有许多成功的实践,对这些行业管理体制、作业流程、应用系统有着比较深入的了解,具备丰富的行业服务经验。

作为第三方服务厂商,金支点致力于打造综合服务品牌,除了突出小型机服务和备件销售的主题,金支点还建立了较广的产品线,在业务上涵盖服务外包、备件销售、租赁到从IT 治理、IT 评估咨询;业务对象涉及国内外市场主流品牌产品,类型涉及小型机、网络、数据库、存储、软件等。

在多年的经营中,金支点与诸多原厂建立了深度合作关系;另一方面,通过标准化管理、经验库储备,结合内部培训演练,让服务实施更精准、问题处理时间更可控。因此有效降低了服务成本,能够以低于行业平均水平的价格为客户提供质量上乘的服务。

目前,公司正在为政府、交通、军工、能源、通信、金融、制造、医疗、教育等领域的上千家客户提供着优质的服务。

在“2020(第十一届)IT运维大会”上,北京金支点技术服务有限公司入选“2020智能运维星耀榜最具影响力企业TOP10”。

中亦科技实现灾备自动化

近年来,因偶然或人为的数据安全事件给企业数据资产的保护敲响了警钟。灾备系统作为保护企业数据资产,开展IT 运维管理,防范各类突发风险的重要手段,已经越来越受到用户的重视。

特别是在金融行业领域,金融科技关系到国家安全,金融灾备体系建设是保障金融机构业务连续性的重要防线,是防范和化解金融风险的有效措施,无疑受到了更多的关注。

但在实际部署和使用过程中,用户却面临诸多痛点,无法充分发挥灾备系统的真正价值。

例如,灾备切换跨多部门协作才能完成,过程复杂周期长;切换过程操作复杂流程繁多,对人员能力素质依赖度较高,误操作风险较高;人工切换时间不可控,难以保证RTO 目标;缺乏实时动态全局指挥决策工具,无法把控整体切换过程;无法实时展现灾备切换过程中业务的变化情况等。

北京中亦安图科技股份有限公司(以下简称“中亦科技”)作为国内领先的IT 架构“服务+产品”综合提供商致力于为客户提供IT 基础架构层从架构搭建、运行维护到自动化、智能化运维的全流程服务,同时为金融、电信、能源、制造、运输、医药、政府等各个领域客户提供基于IT 应用架构层的运营数据分析服务。

中亦科技亦维灾备自动化管理系统(EVO-DR)基于多年灾备建设运维的经验基础上,结合灾备体系的监管要求,实现灾备演练切换过程的标准化、流程化、可控化、自动化和可视化,形成的统一的灾备管理工作支撑平台。该平台可以结合业务视角定期评估,持续改进灾备管理工作,进一步提升数据中心灾备管理的整体水平,充分提升IT 价值和业务连续性。

亦维灾备自动化管理系统针对用户痛点实现多项创新。

首先,系统切换过程实现动态大屏展现,为决策层、指挥层、操作层提供全方位动态视图展现;其次,系统内置大量最佳实践,这些最佳实践基于中亦科技多年大型数据中心运维经验,包括脚本3000+、组件1000+;再次,系统可做到应急预案和切换预案定制,实现切换决策有据可依、指挥快捷高效、操作自动安全可靠;最后,系统能够实现容灾切换演练、真实切换报告自动生成,可根据报告及演练评估结果进行有针对性的改进。

通过以上创新,亦维灾备自动化管理系统在提高灵活性,降低风险,提升效率,控制成本,实现切换专业化的同时,帮助客户达到监管要求,提升灾备系统的可用性和易用性,对行业整体灾备效率的提升具有重大价值。

在“2020(第十一届)IT运维大会”上,北京中亦安图科技股份有限公司和亦维灾备自动化管理系统(EVO-DR)分别入选“2020 智能运维星耀榜最具影响力企业TOP10”和“2020 智能运维星耀榜产品/解决方案TOP10”。

美信科技实现监控全国产化

当前,云计算、大数据、人工智能、物联网等新一代信息技术正掀起数字化浪潮。云计算为大数据、人工智能等新一代技术提供计算基础设施。根据调研机构CloudTech 公司的调查,全球公共云支出预计将从2019年的2290 亿美元增长到2023 年的5000 亿美元,预计复合年增长率为22.3%。相关数据显示,我国2019 年云计算整体市场规模达到1334亿元,增速38.61%。预计到2023 年将接近2300 亿元。同时,物联网也正在彻底改变企业参与竞争的方式。据统计,2020 年,全球物联网设备连接数量将高达123 亿个。预测2025 年全球物联网设备联网设备将达到252 亿个。

随着云计算及物联网时代的到来,IT 监控运维的高要求与低成本之间的矛盾日益突出。超大规模带来的性能要求;监控地域分布的广泛化带来的灵活扩展要求;监控模式的集中化带来的一体化监控需求;SLA 服务水平要求高,运维人员少、运维强度大等行业痛点正成为运维行业亟待解决的问题。

美信科技COO 程永红

美信科技推出的监控易是全国产高性能一体化综合监控平台,主要功能包括:IT设备、动环、物联网一体化监控;故障告警及定位、网络拓扑、视图和图表、业务服务管理、网络流量分析、IP 地址管理、网络配置管理、资产管理、运维流程管理、知识库、可视化展示等。

监控易打破了传统的采用多种监控工具对数据中心进行离散式管理的模式,创造性地通过分布式架构对企业分布在各个区域的IT 系统、生产系统、机房动环的运行状态、健康状况、能耗情况等进行集中统一监测、展示及告警,实现不同系统之间的数据关联和共享。

监控易采用底层分布式架构设计,可以在多中心内网环境、公网环境,以及混合环境实现分布式部署。产品可部署在Windows、Linux 环境中,支持国产操作系统和芯片环境下部署。

据美信科技COO 程永红介绍,监控易的成功主要基于深厚的技术实力和优质的服务,主要为以下四个方面:1.全国产化,完全自主产权;2.高性能分布式架构,适应不同管控模式需求;3.监控规模及性能强大;4.跨区域、跨平台集中监控。

经过多年的发展,监控易已成功应用在政府、能源、军队、金融、教育、制造、交通等多个行业,得到广大用户的好评,成为IT 基础设施运维管控领域的知名品牌。目前已经服务了2000 家以上的大中型政企客户。

在“2020(第十一届)IT运维大会”上,美信科技全国产高性能一体化集中监控平台入选“2020 智能运维星耀榜产品/解决方案TOP10”。

铁路系统运维看北塔

近年来随着信息技术的快速迭代与变革,IT 运维形式在发生改变,其功能也在不断的增加和加深。那么未来的运维管理将如何发展?

面对越来越复杂的IT环境,实现IT 运维的自动化和智能化,以解放人力,提高效率,成为未来IT 运维发展的必由之路。

北塔软件技术总监魏玉雄在2020(第十一届)IT 运维大会上发表演讲时表示,BTSO 产品致力于提供更为普适的智慧运维产品与功能,以期降低IT 运维过程中的专业知识要求、加快问题解决速度,让处于不同信息化阶段/水平的用户均可享受到智慧成果。

BTSO 的智慧运维体现在自动学习、自动分析和自动运维功能上:通过自动学习,系统可智能创建符合用户环境的被管对象的“健康基线标准”;对大多数数据量较少的用户而言,BTSO 提供智维分析中心模块,将企业的用户经验转化为分析方案,让运维工作不再强依赖于个人;通过将专家经验转换为实体分析工具,然后将其固化为智维策略,即可实现自动执行智维策略。

北塔软件技术总监 魏玉雄

铁路行业IT 系统纷繁复杂,且随着“新基建”的开展,城际高速铁路和轨道交通的IT 系统建设必将上升到新的台阶。而这些复杂的IT 系统背后,IT 运维工作也将面临新的挑战。

同其他领域一样,铁路行业IT 运维也存在诸如大量的线下工作,分析问题多依赖人工经验,重复工作费力耗时,缺乏统一的建设标准,运维功能难以衔接,数据难以支撑决策等痛点。

针对以上痛点,北塔软件智慧铁路运维管理解决方案结合用户自身的工作模式,形成贴合用户工作实际的规范稳健的智能运维方案。

该解决方案分两个层面部署:一是租户环境资源部署管理,二是租户内部微应用部署管理。第一个层面包括租户管理员和租户内用户两个角色,租户管理员不使用整个运维系统,仅负责审批租户的开设申请,审批通过后开设租户、部署租户专享的环境资源。第二个层面是租户内的微应用、微服务部署管理,租户内用户在服务目录中心提供的微应用、微服务清单中选择自己想要的服务,由租户管理者按需部署到相应的租户内。

通过以上部署,该解决方案可为铁路行业用户实现事前预测、事中定位和事后分析的覆盖故障生命周期管理的智能运维效果。

在“2020(第十一届)IT运维大会”上,北塔软件智慧铁路运维管理解决方案入选“2020 智能运维星耀榜产品/解决方案TOP10”。

东华AIOps 助推智能运维实践

近年来,IT 运维正在向智能化、自动化方向发展。

AIOps 是实现智能运维的重要技术手段,它是将大数据技术、机器学习技术、自动化作业技术应用于运维领域,把IT 人员从繁复耗时、重复执行的基础运维工作中解放出来,专注于更有价值的业务运维。

东华网智高级顾问曹华在2020(第十一届)IT 运维大会上对AIOps 应用场景体系进行了深入分析。曹华表示,AIOps 从质量保障、成本管理和效率提升三个维度切入,为传统运维工作注入新的可能性。

当前智能运维研究与应用在国内外各行业中都属于起步阶段,目前还没有“全景适用,开箱即用”的产品和方案。AIOps 研究者也都是根据实际工作需要各自研发和训练适用自身IT 环境的场景工具,系统平台各有侧重,但总体还是聚焦于以上三个方面。

东华网智高级顾问 曹华

东华AIOps 运维解决方案将大数据技术、机器学习技术、自动化作业技术应用于运维领域,围绕质量保障、成本管理和效率提升这三方面构建基本运维场景。

在质量保障方面,包括异常检测、故障诊断、故障预测、故障自愈等场景;在成本管理方面,包括成本优化、资源优化、容量规划、性能优化等场景;在效率提升方面,包括容量预测、智能变更、智能问答、智能决策等场景。

该解决方案充分利用机器学习技术来实现智能化,具体表现在以下方面。

通过机器学习算法分析指标特征,提升指标异常的检出精度;通过机器学习发现潜在的告警关联,帮助定位根源告警;逐渐完善自动化的故障恢复机制,丰富故障自愈流程和脚本库;通过建立设备画像,确立基线,提前捕获故障发生的征兆,主动采取预防措施;通过将运维相关的文档,比如知识库,故障处理预案,故障处理实例等建设成知识图谱,让AI掌握运维领域知识,从而提供智能问答机器人,智能运维助手等能力;通过设备智能画像,可在宏观层面了解设备的资源使用特点,从而为资源和成本优化奠定基础;通过机器学习算法,掌握设备、系统的资源需求趋势、周期等特点,为系统扩容提供科学的决策依据;基于资源使用特征,结合预测算法,实现资源按需分配,动态扩缩容,优化资源利用率,为每一个计算需求都匹配恰当的资源。

目前该解决方案已在电信云运营等场景下有成熟的应用实践。

在“2020(第十一届)IT运维大会”上,东华AIOps 运维解决方案入选“2020 智能运维星耀榜产品/解决方案TOP10”。

豪越科技构建智能运维之路

当前,传统运维方式已无法适应复杂多变的IT 环境,尽管企业投入大量的人力物力,依旧无法解决不断出现的IT 故障与问题。

在豪越科技看来,传统运维系统早已落后于市场需求,实现智能运维已是大势所趋。

Gartner 预测,至2022年,大型企业中的50%将会部署AlOps 平台,进行数字化转型。许多企业将会利用AlOps 进行业务运营和IT 运维,取代如今的运维工具。

豪越科技创新服务事业部总监侯方表示,豪越科技新一代智能运维具备统一、完整、闭环与智能化的能力。

豪越HYDO 智能运维大数据管理平台针对各行业面临的IT 集中管控需求,实现了集中监控、统一登录、运维服务、数据分析、自动巡检等功能。

豪越科技创新服务事业部总监 侯方

具体来说,平台通过单点统一登录,为外部门户和内部门户网站提供系统支撑;标准化管理,建立健全规范高效的IT 管理机制,实现IT服务台、IT 运营管理、外包和资产管理等职能;综合监控系统主要对应用、网络、主机、数据库、中间件、存储以及机房等进行统一的综合监控和汇总分析,提供网络拓扑管理、资源列表监控、异地监控、大屏展示等监控展现形式;基于应用系统数据分析和监控功能,对性能数据进行智能分析,持续优化业务服务的性能和可用性;通过添加任务及脚本,按需进行自动化巡检;实现对基础监控、数据库/中间件/虚拟化监控、涉密机监控等5大模块、22 类监控对象的实时监测和数据采集;通过服务器监控和管理,清晰地查看某一个主机、某一个品牌的设备、某操作系统的服务器是否正常运行。

通过该平台全方位的监控管理,集成多个报障入口,保持用户操作和使用习惯;自动化触发流程,将监控系统发现的告警,按照预先定义的规则转给相关人员进行处理和确认,提升故障处理效率;统一管理IT 的各种资源,无需来回切换系统进行管理等特性,为用户增强信息化管控能力,提高经营管理水平,加强信息化运营。

平台最终可为用户实现网络拓扑图的自动发现、自动绘制;实现面向业务和IT 服务的管理模型;实现IT 运维设备集中式、周期性、7×24的全天候性能信息采集。

豪越科技多年专注于智能运维领域,为政府、军队、教育、医疗、科研等多个行业和领域用户构建智能运维整体解决方案,为各行业业务战略提供良好支撑。

在“2020(第十一届)IT运维大会”上,豪越HYDO 智能运维大数据管理平台入选“2020 智能运维星耀榜产品/解决方案TOP10”。

猜你喜欢
数据中心运维解决方案
高速公路智能运维平台
艾默生自动化解决方案
解决方案和折中方案
浅析数据中心空调节能发展趋势
简洁又轻松的Soundbar环绕声解决方案
关于建立“格萨尔文献数据中心”的初步构想
2017第十届中国数据中心大会榜单
配电线路的运维管理探讨
基于一体化的变电标准运维模式
7大睡眠问题解决方案