大数据思维下信息中心智能化

2021-11-20 09:45冷迪陈瑞李英王旭勇
电子技术与软件工程 2021年15期
关键词:信息中心器件数据中心

冷迪 陈瑞 李英 王旭勇

(深圳供电局有限公司 广东省深圳市 518000)

海量数据时代信息中心的地位越来越高,一个好的信息中心可以为一个企业带来非常好的促进作用。随着计算机技术的发展,各大企业的信息系统越来越多,数据量也越来越大,安全生产对信息预测的要求也越来越高,面临种种现实问题,信息中心必须不断升级,实现智能化。信息中心智能化必须要充分考虑大数据背景,在利用好现有先进技术的基础下,极大程度实现人工的解放,以更加智能化的方式将企业数据展现出来,并未企业管理与发展提供良好的觉得数据依据。

1 信息中心建设存在的问题

信息中心建设一把来讲首先要考虑数据中心机房的建设,建设在设么位置,如何建设,目标企业到底需要建设什么级别的信息中心,如何进行信息中心的整体布局,能耗如何达到最佳效果,如何保障制冷问题。除了硬件相关问题,异构的系统如何整合,数据如何存储,信息如何分析利用与展示,如何用新技术、新思想进行信息业务全流程的管理等。对于已经建成的信息中心,可能更多的要考虑均衡能耗与环保、优化信息中心布局、信息中心运维方面的问题。特别针对运维的问题,企业承受能力之下聘用的运维人员在能力与数量方面可能会跟不上实际需要,或者说无法将数据中心的作用充分发挥出来,这就需要通过技术手段将信息中心智能化,通过大数据、人工智能等计算分析方法进行短周期一次性建设,解决大部分数据中心面临的数据杂乱标识度低、系统异构集成数据可融合性低、数据共享与分析展示不彻底等一系列软问题。

2 大数据方法

2.1 标签画像

Web2.0时代被广泛使用的tag标签实际是一种关键词标记,可以方便与更好的索引、浏览、查找数据,与常说的关键词相仿但又有很大的不同,标签可以是能够更好的显示和突出搜索的关键词条,也可以是文章或日志中没有出现过的词条,设立标签的意义是指向这个文章的内容性。标签具有两个非常明显的特征,一是数据可重复性标记,对于同一个用户、同一条数据信息可以给予多个标签,类似于实物建模,信息标签越多,就可以更好的组建一个越来越完整用户受众画像信息;标签的另一个特征就是指向明确性,标签前应当明确的标识用户的一类属性或行为,对于数据信息来讲则是指向信息的具体归类或特征。对于数据中心来讲,信息系统的用户、监测的设备都可以看做一种特定的数据对象,以进行数据应用分析。标签画像一般需要经过标签梳理、数据逻辑构建、数据仓库构建、标签计算、标签可视化等过程,最终将杂乱无章的数据以一副形象规整的画面呈现出来。

2.2 敏捷数据分析

传统数据分析流程比较复杂,特别是需要建模与Cube这两个操作,这一系列复杂流程通常要耗费数月的时间。对于数据中心来讲,更多的时候是需要对实时信息进行快速计算、分析、呈现,特别是一些实时性要求比较高的行业,如输配电行业、化工生产等。敏

捷数据分析实际上是用快速迭代式分析来取代传统数据分析流程,不再纠结于构建大而全的分析指标体系,利用短则几分钟进行低成本快速迭代,利用敏捷数据分析工具实现动态切换视角,灵活展示数据,在日常积累过程中行程越来越丰富的指标,计算公式在日常过程中不断优化,这一过程有一定的上下文自学习性,在一定过程以后再对这些指标化后的海量数据进行体系化。敏捷数据分析就是实现快而有效的数据分析结果交付、数据部署、数据呈现指标变更和数据分析结果查询。

2.3 机器学习方法

机器学习本是一门研究如何利用计算机模拟或实现人类的学习行为,让计算机拥有一种获取新知识的能力,从历史信息中挖掘出一系列新方法、新内容,将已有的知识结构重新组织,不断完善自身的学习能力,从而实现信息分类达到准确预测的目的。常见的机器学习方法有, 采用非线性变换将的空间高维化实现线性分类的支持向量机算法,以一种设定学习准则为起点不断进行自我学习调整的人工神经网络算法,通过学习样本数据的内在规律和表示层次来不断加深学习能力的深度学习。机器学习的应用目前非常广泛,以Siri、小度等为代表的可以协助信息查询的虚拟助手,以GPS导航为代表的交通预测,通过多层感知器与决策树归纳实现的垃圾邮件和恶意软件过滤。

3 信息中心智能化

3.1 信息中心智能化方向

信息中心智能化是信息中心建设到一定程度后的必然方向,单纯的信息采集、存储于查询无法更好的发挥信息中心的潜在作用。信息中心智能化主要是三个方面:

(1)要信息系统用户界面智能化极大程度解放人工;

(2)实现数据过程智能化与数据呈现凸显化多样化;

(3)信息反应能力智能化。

信息系统用户界面智能化主要是指对集成后的信息系统优化,包含信息系统界面优化与信息系统操作优化两个方面,理想的信息系统在显示与操作界面要充分凸显重要内容,让操作人员能够最边界发现数据内容的异样变化,还要在操作方面让操作人员基本做到零操作,特别是零误操作,这就需要深入结合心理学、生物学、人工智能技术。

数据过程智能化就是要从数据的接入到输出整个过程全面智能化,在现场信息采集方面运用传感器技术、无线自组织网络技术等实现细节数据的实时采集与快速传递;在信息系统数据集成方面要通过标签画像技术将已有的海量数据快速整合,规范化存储分类;在数据分析方面,要采用敏捷数据分析与传统数据分析相结合的方式,保证实时数据能够被快速分析呈现给操作人员与决策人员,还要尽可能的深层次的挖掘历史数据,优化数据的使用。数据呈现凸显化多样化,就是要运用3D建模、多维度数据显示,使用动态变化甚至能够自我学习变化的模型来展示数据,让数据使用者能够更加直观、形象化的理解使用数据。

信息反应能力智能化,将是大多数企业所急需的,从智能BI的角度来讲,企业更希望在发现网络数据发生凸显性变化时,信息中心能够快速的根据数据变化方向给与决策者提供强有力的核心支持。而对于一些基础性建设生产的企业来讲,则希望信息中心能够通过数据变化快速发现安全报警隐患,并对生产现场发送智能操作指令,在最小人工干预的情况下将安全隐患消除,或者通过设备切换,通知人员进行问题设备检修,避免设备带病运转。

3.2 基于大数据方法的数据告警自愈

2016年,Gartner针对IT发展和运维管理的困境,提出了一种全新的运维管理方法,以减轻企业IT的负担,提升管理效率,简称AIOps。AIOps 即Artificial Intelligence for IT Operations,将人工智能应用于运维领域,区别于传统的人工运维和自动化运维,通过基于运维大数据的机器学习,用智能决策逐步取代人工决策,提升IT管理效率,因此国内业务运维企业云智慧把AIOps称为智能运维。自动化运维因此应运而生。用可被自动化触发、预定义规则的脚本,来执行常见的、重复性的运维工作,从而减少人力成本,提供运维效率。总的来说,自动化运维可认为一种基于行业领域知识和运维场景领域知识的专家系统。下面给出一种基于大数据方法的数据告警自愈方法。

对数据中心的系统下所有器件运维数据进行检测,通过在确定某一器件发生告警事件时,本方法除了会对该告警事件所对应的器件进行检测及处理后,还会对该器件相关联的设备进行检测,以全面对与该器件相关联的设备进行告警检测,能够将接近产生故障或告警(或者即将产生故障或告警)的设备一同发送给工作人员进行检测及处理。具体步骤如下所示。

第1步:实时监控数据中心的系统下所有器件的运维数据;这个过程是对所有采集到的实时数据进行监控,只要有新的事件信息传输到数据中心,必须要立马对其处理。一方面触发相应的服务器对数据进行分析,另一方面要根据相应的画像策略为数据打上标签,微数据打上标签后进行分类有序存储,为数据进一步分析坚定基础。

第2步:通过运维数据判断该大数据中心的系统下的器件是否产生告警事件。这里要用到机器学习的方法,服务器对新监测到的数据与历史数据的学习结果进行对比,从而判断新监测到的事件数据是否属于告警事件,如果是应当属于那一个级别的,具体的再对识别到的告警事件进行策略性处理,也就是第3步所描述的。在这一步,主要依赖于对数据库中使用数据画像进行了标签化的历史数据进行学习归类,生成一定的可参照空间。但对于新收到的数据必须要快速的分析,这就要使用到敏捷数据分析,这一个敏捷过程就可以将新事件数据信息与经过机器学习分类过的数据空间内容进行快速的上下文学习分析,一方面得出数据事件的性质定位,另一方面通过这一快速迭代及时的更新事件库。

第3步:如果是,根据预设屏蔽策略对告警事件进行屏蔽,根据预设收敛策略对告警事件进行收敛,以获得最终的有效告警事件。应理解,一些告警事件能够被系统自动处理,因此这些告警事件会屏蔽,而如果属于多次同样的告警事件,则对这些同样的告警事件进行收敛。因为很多现实状况中,采集到的数据并不准确,很多时候用于器件信息采集的传感器会产生一定的采集误差,采集到的数据通过模数转换时也会产生一定的误差,导致事件数据有些是偏差型数据,即便比对成功也不是真正的告警,也就是误报警。

第4步:获取有效告警事件所对应的器件信息,从器件信息中解析出对应的工作人员,并将有效告警事件及器件信息发送给工作人员。这主要是由于很多涉及到重要生产的行业,告警事件的处理完全依赖于机器并不能让管理者、使用这完全放心,主要还是由于机器学习于敏捷数据分析还未达到完全精准的地步,因此很有必要通知工作人员,一方面如果有需要人工现场处理的工作可以让人员及时到场,另一方面,如果一些事件告警是误报或者没能确定是否是告警的情况下,可以通过人工进一步判断已解决问题。

第5步:获取与该器件相关联的设备的信息,并逐一对与该器件相关联的设备进行检测。应理解,该器件与相关联设备是同一系统下的。这主要考虑到设备之间具有很强的关联性,一个确定发生故障告警的器件可能会导致其他器件发生问题,当然发生故障告警的器件的问题也可能是由其他器件发生问题导致的,只是由于某些原因没有被侦测出来。

第6步:判断与该器件相关联的设备是否接近产生故障或告警的条件。应理解,这里接近是指很靠近故障或告警条件,或者即将产生故障或告警。设备的故障预防也是很重要的,这一步操作主要是防患于未然,将安全意识充分体现在事件分析处理上。

第7步:如果是,将接近产生故障或告警(或者即将产生故障或告警)的设备的信息一同发送给工作人员,使得工作人员关注这些关联的设备,提前预知这些设备会产生告警,提前处理。应理解,这些工作人员都是处于上班状态(可通过查询打卡的工卡来判断),且所懂得领域刚好与发生告警事件的设备的领域相同。

4 总结

科学技术飞速发展的时代,信息中心必须在先进计算机技术的发展下不断完善,朝着更加智能化的方向发展。大数据时代下的标签画像、敏捷数据分析、机器学习等为信息中心朝着用户界面智能、数据过程智能、信息反应能力智能带了众多空间,为企业利用好信息中心实现新的发展带来了新的可能。

猜你喜欢
信息中心器件数据中心
酒泉云计算大数据中心
2019年中国化工信息中心 7大期刊电子版联合订阅:
2019年中国化工信息中心 7大期刊电子版联合订阅:
民航绿色云数据中心PUE控制
重庆市地理信息中心
旋涂-蒸镀工艺制备红光量子点器件
基于云计算的交通运输数据中心实现与应用
面向高速应用的GaN基HEMT器件
一种加载集总器件的可调三维周期结构
高分辨率遥感相机CCD器件精密热控制