基于数据中台架构的主数据平台设计与研究

2020-03-13 08:13石冬喜汪思冰
甘肃科技纵横 2020年1期
关键词:数据治理数据中心

石冬喜 汪思冰

摘 要: 随着信息化技术的快速发展,高等学校信息化建设已经基于数据采集工具实现了数据交换,基本上可以满足跨部门数据的共享需求。但在实际数据相关工作中数据采集工具的局限性非常的明显、数据质量存在的问题较为突出,主要原因是学校的业务发展比较快导致了数据类型的多样化、数据规模非常庞大,而数据治理能力却欠缺。建设学校数据中心已经成为各个高校关注的问题,本文将对数据中心建设提出框架和思路,对具体落地实施提出的想法,物联网技术在智慧校园中的应用将会得到普及,其中的相关数据将会无缝的接入到数据中心,为学校师生提供更好的服务。

关键词: 数据中心;数据治理;数据展示

中国分类号:G31           文献标识码:A

1、引言

现阶段各高校数据治理遇到一些瓶颈,主要表现在:数据交换方式局限性高、数据资源目录尚不清晰、数据处理自动化程度低、可视化监控能力待提升、数据治理和开发能力亟需加强、重复填报数据,降低工作效率等问题,数据中心建设就是为了解决以上问题并且采用先进的技术来解决高校多变的需求。

数据治理项目建设主要内容包括:数据治理服务、数据交换服务、数据总线服务、数据治理规范标准设计、数据应用建设、数据展示(人员画像)应用建设、数据安全管理。作者在高校信息化部门从事十多年的工作,结合高校实际情况进行了深入理解和总结,通过本文使以后的数据中心建设提供一些建设性的意见,供教育界同行借鉴。

2、整体框架和建设思路

数据中心建设是一个系统工程,需要高校投入大量的人力和财力,是一个循序渐进逐步建设的过程,而不是一蹴而就的工程,作者认为数据中心建设需要分两步完成,第一步是数据中心平台基础工作建设,第二步是智慧化数据中台建设。第一步建设是后续工作建设的基础,第二步建设是第一步建设的扩充。

2.1数据中心建设基础工作

基础建设工作如下图1智慧校园建设基础平台所示:

数据中心平台基础工作主要包括:数据标准、主数据平台、数据库建设、数据交换平台、数据服务总线、数据展示平台六部分组成。所有的工作都是围绕着数据标准这一工作进行,数据标准主要是依据“JY/T 1006-2012高等学校管理信息”、“JY/T 1001-2012教育管理基础代码”、“JY/T 1002-2012教育管理基础信息”、“JY/T 1003-2012教育行政管理信息”、“JY/T 1007-2012教育统计信息”教育部标准,同时结合学校的实际情况建设学校的校标,这项工作关系到学校信息化建设的质量,具有关键性的作用。

2.2数据中心建设之数据中台

数据中心平台建设的第二阶段是在第一阶段完成以后进行展开,主要是对基础阶段的扩展与扩充,最大限度满足学校师生的各种需求。如下图2智慧校园数据中心平台第二阶段建设架构如图2所示:

第二阶段建设在第一阶段的基础上融合了大数据和人工智能技术,满足更加复杂可变的需求变化。这个阶段数据应用中心建设价值主要满足快、准、省工作。快,主要是满足学校快速多变的数据需求;准,主要是准确反映相关真实的数据情况;省、是实现最小的成本,满足各种学校信息化需求。

3、关键技术介绍

3.1、数据治理服务

数据治理服务依托于主数据平台完成,主数据平台以教育部《教育部2012版教育信息化数据标准》为基础。按照面向对象设计理念,主数据库模式是按照对象和高校核心活动进行划分的,从总体上对高校上层应用及数据进行梳理,由应用来推导模式的设计,由模式反向衍生、扩展上层应用。

3.2、数据交换服务

构建数据交换平台,保障数据层的互联互通。通过商用的数据交换平台完成学校基础数据库、业务数据库、主题数据库和文件数据之间的数据交换作业设计、调度、管理和监控的软件系统,为建立学校数据仓库的铺垫基础。

3.3、数据总线服务

构建校园服务总线平台,保障应用系统间互联互通。通过专业的商用服务总线产品来保障学校应用系统之间在消息、事件和服务的级别上动态的互连互通软件系统,通过校园服务总线消除异构系统间技差异,实现不同服务之间的通信与整合,推动学校业务部门之间业务协作。

3.4、数据治理规范标准设计

学校信息标准是学校范围内的数据字典,为信息交换、资源共享提供基础性条件。是学校信息化建设的重中之重,对推进学校信息化建设,保证各类信息的交流与共享,有着重要意义。信息标准需要保证采集、处理、交换、传输过程中有统一、科学、规范分类和描述,能够使信息有序流通、最大限度地实现信息资源共享,使学校信息系统得到协同发展,发挥信息资源综合效益。

3.5、数据应用建设

数据应用中心建设价值主要包括:快、准、省;概括来说就是快速、准确的对学校信息化相关需求进行回应,同时在最少可控的成本内完成。

3.6、數据展示(人员画像)应用建设

通过图形化手段清晰地传达数据,促进信息的传递与沟通,是数据可视化的基础要素,也是设计美学和功能相结合的具体表现形式。可视应用平台理论的背景下,围绕“数据视图”和“可视组件”两个核心概念设计,支持多种可视化功能。支持各种不同的数据源对接。

3.7、数据安全管理

建设可靠的数据安全保障体系,实现应用服务及数据调用的安全认证和安全审计,主动的异常数据操作行为的监控分析、预警机制,并提供异常问题的倒查追溯能力。

4、具体落地和实施步骤的思考

智慧校园建设之数据中心建设落地实施过程是一个系统工程,首先需要学校领导层的重视,给予信息化部门更多的权力,而不是仅仅资金上的支持,需要的是全校各个部门协作,共同制定学校的数据标准。其次需要高校信息中心领导和技术工程师的协作,管理和技术二个方面都不能或缺。管理方面主要包括协调学校各个二级部门和对中标公司项目的合作与管理。技术部分主要包括,标书技术方案的制定,核心技术可行性的调研,以及项目验收过程中技术部分的检查,后期项目的维护工作等。然后是中标公司的协作,中标公司需要按照学校合同标书严格执行相关工作,在实施过程中遇到困难及时和学校沟通、商议得到可行性的方案,共同完成合同规定的各项工作,服务于学校师生。

平台架构的设计需要充分考虑其先进性并且可以落地实施,能为学校发展提供有力支撑,数据中心建设主要围绕以下五点建设:

4.1、规划先行,巩固成果

根据校情现状做好平台框架的规划设计,体现顶层设计上的大格局。需要建立数据生产、数据治理、数据开发(包含业务模型探索)以及数据应用的闭环数据生态,符合未来五年的政策发展要求,适应变化频繁的业务发展要求,更好地满足广大教职工和学生在校工作、学习的发展要求。

4.2、积累数据,滴水成河

完善现有的数据采集机制,为把“小数据”做成“大数据”提供良好的基础环境。主要包括以下三点:

丰富数据采集类型,利用更多的技术手段和工具从结构化数据往半结构化、非结构化数据的方向发展;

丰富数据采集的源头,建设更多的小应用下沉收集数据,并提出小应用的管理办法;

丰富采集数据的形式,为散落在电子表格中的、临时需要填报的数据提供新渠道,利用长短结合的方式不断突破、推进大数据的建设。

4.3、拓展对象,面向问题

在数据安全得到保障的前提下,扩大数据应用的对象和范围。不断强化信息安全意识,健全网络安全管理制度,创建可靠、可控、可查的网络信息安全技术防护体系,树立正确的网络安全观,将服务对象拓展到校级领导、职能部门、教学单位、直属单位和教职工以及学生,科学地分析、收集服务对象的数据应用需求,并提出对应的解决办法,切实帮助服务对象解决目前在工作、学习中使用数据的困难,使他们在安全的闭环数据生态中持续获益。

4.4、深化应用,融合创新

治理数据的目的是为让数据用起来,让数据“说话”,发挥其应有的价值。本期项目的建设需要立足于解决学校发展面临的实际问题,坚持“以应用为导向,以好用为导向,以用好为导向”,促进管理水平和服务能力的提高。在服务对象覆盖面越来越广的基础上建设以师生需求为导向的数据服务与大数据分析,配合目标管理系统的建设,实质性推动诊改工作,体现产学融合的新实践,探索准确评价的新模型。

4.5、横向共建,促进协同

加强“数据”与“业务”的关联性,引入“数据中台”的关键设计理念,并通过数据中台的架构完善数据平台,降低重复建设,减少烟囱式协作的成本,将学校的发展需求和师生的发展需求纳入数据应用协同的体系,提高将数据(信息)作为基础设施的认知程度,不断通过数据应用来满足使用数据的需求,通过使用数据的需求又不断促进数据应用的提升,这个过程就是跨部门横向共建。项目要在理念设计和软件实现上围绕这一本质内容开展,建立学校的数据应用协作机制,推动信息系统建设和应用从服务教育部门和学校管理、监管为主的现状往服务全校师生教育教学的过程发展。

5、数据中心发展展望

5.1、人工智能,深度学习在数据中心发展展望

AI赋能是一套智能模型全生命周期管理平台和服务配置系统,基于数据中心平台服务,通过对智能服务的共享复用、对智能服务研发相关角色进行管理,以及研发流程的标准化、自动化,对前台业务提供个性化智能服务的迅速构建能力的支持。

以贫困生决策树模型建设流程为例,具体需要如下工作:开始->数据中心平台中选取消费数据->统计学生各类消费信息->将数据拆分成训练集和测试集->利用训练集构建决策树模型->运用测试集对决策树进行剪枝->结束。

5.2、物联网技术相关数据的融合

本文以窄带物联网为例,智慧校园建设将会在不久的将来得到普及化的应用,数据中心将对接物联网数据,具体实现如下图3窄带物联网技术框架图 所示:

终端设备发送信息,通过窄带物联网信息提供商电信邮局完成数据发送到云端服务器,云端服务器把数据保存到数据库中,同时开放数据接口给各个应用,用户可以在移动终端访问终端设备,并且发送相关指令到终端设备中去。终端展示可以是PC电脑,微信,手机APP等。物联网技术在智慧校园中的应用将会在不久的将来得到普及,其中的相关数据将会无缝的接入到数据中心,为学校师生提供更好的服务。

参考文献

[1].贾海天,陈晨.大数据环境下的智慧校园建设与应用.科技创新与应用,2019年20期: 162-163.

[2].Haitian Jia; Chun Jia;. Research and Application of Data Standard Construction .   2018 the 2nd annual International Conference on Cloud Technology and Communication Engineering 17–19 August 2018, Nanjing, China

[3]劉屹.基于云计算环境下的教育信息化资源平台分析与设计[J].福建电脑,2016(8).35

[4].Haitian Jia; Chun Jia;. Construction and Application of Data Standard in Big Data Environment, The 2019 1nd International Conference on Big Data Engineering (BDE 2019)  ,11-13 June, 2019, Hong Kong,China

[5].曹建梅,崔凤磊,杨祥来.职业院校智慧校园顶层设计研究与实践.电脑知识与技术,2017(6): 44

[6].曾祥容.基于防火墙和WAF安全设备的高校信息安全设计与应用.电子技术与软件工程,2017(5):201

邮寄地址:苏州国际教育园北区学府路287号会国学院,215009

[作者简介]石冬喜,(1984-),男,汉族,助理研究员,江苏苏州人,工学硕士,主要从事高等教育管理研究。

猜你喜欢
数据治理数据中心
关于间接蒸发冷机组在数据中心中应用的节能分析
2018年数据中心支出创新高
北京科创新型云数据中心
2017第十届中国数据中心大会榜单
高校数据融合路径及其治理框架的探讨
基于本体的企业运营数据治理
云端数据治理初探
大数据治理模型与治理成熟度评估研究
大数据时代城市治理:数据异化与数据治理
新一代数据中心建设有“书”可循