高校内部数据治理的现状分析及实践

2023-08-21 11:05杨强
现代信息科技 2023年12期
关键词:数据治理数据质量数据安全

摘  要:近几年高校信息化技术高速发展,高校积累了大量数据资源,提升数据质量是高校实现高质量发展的必然选择。文章参考国内高校数据治理的实施经验与研究方法,探讨了数据治理的内涵和高校数据资源多样性模型,分析了高校数据治理中存在的困难,基于此提出了高校数据治理建设路径,构建数据治理全生命周期生态体系模型,提升数据资源的安全性、可用性,进一步推进智慧化校园发展。

关键词:高校内部数据;数据治理;数据安全;数据质量

中图分类号:TP39  文献标识码:A  文章编号:2096-4706(2023)12-0120-05

Analysis and Practice of the Current Situation of Internal Data Governance in Colleges and Universities

YANG Qiang

(Yancheng Teachers University, Yancheng  224002, China)

Abstract: In recent years, with the rapid development of information technology in colleges and universities, colleges and universities have accumulated a large amount of data resources. Improving data quality is an inevitable choice for them to achieve high-quality development. Referring to the implementation experience and research methods of data governance in domestic colleges and universities, this paper discusses the connotation of data governance and the diversity model of data resources in colleges and universities, analyzes the difficulties in data governance in colleges and universities. Based on this, it puts forward the construction path of data governance in colleges and universities, builds the ecosystem model of data governance in the whole life cycle, improves the security and availability of data resources, and further promotes the development of intelligent campus.

Keywords: internal data of colleges and universities; data governance; data security; data quality

0  引  言

2018年4月,教育部发布了《教育信息化2.0行动计划》“努力构建教育服务新模式、人才培养新模式、教育治理新模式”。《中华人民共和国数据安全法》要求:“开展数据安全治理、数据开发利用等领域的国际交流与合作”。大数据是信息化发展的新阶段,要善于获取数据、分析数据、运用数据,增强利用数据推进各项工作的本领,使大数据在各项工作中发挥更大作用[1]。通过数据治理加强数据的管控,保证数据的质量,充分挖掘数据的价值[2]。

在“互联网+”,大数据背景下,高校数据治理建设是新时代网络安全趋势,是信息化与教育现代化深度融合的手段。搭建数据治理生态大数据平台是智慧校园发展重要组成,运用信息化手段,为师生提供更优质的数据支撑。

1  高校数据治理中存在的问题

1.1  数据治理的定义

治理是人、团体组织运用各种管理方式的处理一系列事务总和,它是使相互冲突或不同的利益得以调和并且采取联合行动的持续的过程[3]。“数据治理”(Data Governance)是指在授权范围内对数据采取相应的措施[4],国外的学者大量的研究,以ISO为标准的《资产管理综述、原则和术语》提到“数据资产管理”,以及《信息技术组织IT治理》分析了“IT治理”等,以IEC标准的《信息技术大数据参考架构第三部分:参考架构》涉及了数据资产管理、系统运维监控等,以ITU-T为标准的《技术规范D2.1物联网和智慧城市及社区数据处理和管理框架》涵盖了数据资產管理、生命周期管理、风险过程管理等。

通过对ISO、ITU-T、IEC三大国际标准组织提出的四种数据治理定义分析,得出国际标准中的数据治理是“数据治理”内涵、“数据管理”含义、“数据质量管理”概念等的交集,数据管理中的质量管理和过程管理与数据治理密切相关[4],如表1所示。

从四种标准组织给出的定义,我们了解到数据治理会涉及数据管理,数据血缘监控,数据质量管控,元数据一致性测试,完整性检测等多个方面。数据治理与IT治理、数据管理既有包含整体与部分关系,又有一定关联性。因此,数据治理是梳理高校部门职能,建设校级教育数据标准、全域数据模型,制定科学的数据安全管理体制及策略,利用大数据平台记录信息系统的教育数据从产生-抽取-转换-共享-使用-消亡过程,并对教育数据进行监控、分析、归属划分、使用等战略信息协同行为,从而反馈给教育数据相关责任单位、管理人员加强教育数据完整性,唯一性等一系列活动,旨在提升高校教育数据价值。

1.2  数据治理模型构建

国内外针对数据治理模型研究十分广泛,美国国家科学基金建立DATA ONE模型,受到环境、网络、文化、规制、技术等多要素的影响[5]。国际数据治理研究所(DGI)提出的DGI数据治理模型,包括组织架构、信息协同处理规则、过程三大部分[6]。国际数据管理协会(DAMA)数据治理模型受到数据管理功能与环境要素的影响。另外,《数据管理能力成熟度评估模型GB/T 36073—2018》中提出“数据管理能力成熟度评估模型及相应等级”。《国外数据治理模型比较》论文中提到“在数据治理模型构建中,模型不是一成不变的”,《我国高校科研数据治理模型构建研究》说明“治理模型应涵盖人、数据、实践操作等多个环节”。

笔者主要分析了讨论比较多的DTAT ONE模型、DGI模型、DAMA模型的名称、定义与组成、异同对比,如表2所示。

1.3  高校数据治理过程中存在的困难

笔者从数据治理概念、构建治理模型分析,数据治理模型的功能以及对其影响因素分为有覆盖宏观、中观和微观三个方面[7],高校在实施数据治理过程面临很多挑战。

1)数字校园建设初期,高校信息系统建设普遍存在“重功能轻数据”情况,各部门为更好地管理本部门数据与方面部门管理,缺少高校数据标准整体规划,各信息系统之间存在字段标识差异,数据流通存在壁垒,影响了数据的交换和使用,多个业务系统重复采集相同数据,不方便为师生服务。前期高校建设了三大平台目的打通数据孤岛,但只有部分数据参与共享,许多高校数据的跨部门协调需要付出高额的沟通成本与维护成本,而且面对复杂多变的技术发展存在很多困难,如网络安全性、数据安全性、数据唯一性、数据时效性等仍受到传统共享的局限。

2)数据管控体系,历史沉淀的数据多部门管理,缺少专门对数据资产的管理和监控的组织。另外,受限于现有技术,即使在数据领域的各类数据资源也很难做到准确管理,这样导致学校数据资产大都只存在于业务部门甚至厂商手中,数据在手却无法使用,当学校去开展具体业务,如开展报表填报、各类业务考核时才去查找所需数据,这往往会导致系列问题。

3)没有对数据进行全生命周期管理。目前,学校数据的生产、采集、交换、运维到消亡的数据处理流程不规范,缺少对过时无效数据的审查,没有采购信息化软件对历史数据生命周期进行监控。导致高校数据只能在简单的层面发挥作用,无法深层次挖掘和分析数据的价值,难以支持领导决策。

4)高校教育数据质量管控体系不完善。现在数据质量由各业务部门自行管理,系统建设时业务部门间沟通交流少,没有制定数据质量管理的标准,业务部门需要数据类型多样性,影响数据质量。现有的集成工具不能很好采集数据,很多需要人工处理完成采集,业务部门的操作员网络安全意识低、没有经验处理数据资源等问题,缺乏统一的高校数据质量生态管控体系。

5)大数据挖掘能力不足,大数据挖掘需要从高校庞大的碎片化数据中分析有价值的内容,如迎新信息、就业信息、选课记录、学生成绩、一卡通刷卡记录、宿舍刷卡信息、图书借阅记录等数据,虽然加强了对结构化数据的整合,但非结构化数据还没有不重视。不能意识到校园内除了目前已有的结构化数据外,还有学习行为数据、上网行为数据、活动轨迹等非结构化数据,需要将结构化数据和非结构化数据进行协同分析、整合才能充分发挥高校教育数据价值。

6)数据质量管理人员不足,普通高校的缺少高端数据治理人才,导致对高校的数据治理的整体规划弱,只完成了数据层面的治理[8]。高校并没有专门人才针对学生在线教务平台行为数据、上网数据、消费数据等相关重要整合分析,无法快速为领导层决策。

2  高校数据治理思考与实践

《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》,提出“建立数据资源产权和安全保护等基础制度和标准规范,推动数据资源开发利用”“积极参与数字领域国际规则和标准制定”,建议与现有国际标准中的数据治理主要功能相近。做好高校的数据治理是一个烦琐、长期循环的历程[8]。

2.1  统筹协调实现业务数据的全量治理

数据是学校重要资产,因此需要统筹建设全校性数据治理平台解决数据共享难问题,提升高校信息化系统水平,已是当务之急,刻不容缓。需协调学校各业务部门梳理本部门的数据,对学校进行数据治理,制定一套科学符合高校自身数据管理方法,对学校各业务系统中存在全域数据进行采集、存储、分类建模、监控、共享,规范数据权责,提升数据质量和数据全生命周期的业务流程监控体系,建立高质量、安全的、可扩展的基础数据库,方便高校管理者决策规划高校的发展,支撑高校各部门业务数据需求。

2.2  明确从数据集成向数据运营转变目标

随着互联网+、生物识别技术、物聯网的普及,高校内部教育数据的增长迅速,使用者不再满足于简单取得数据,更多应用开发单位或人员推崇从大量的教育数据中挖掘整合有价值的信息,利用大数据平台采集和分析各业务系统的数据,构建一套完整的符合高校发展的数据模型,更好为数据需求者提供支撑服务。大量高校教育数据的协同、共享、分析,对于高校的发展起着至关重要的决策作用。

2.3  强化数据安全与隐私安全

数据开放共享前提是网络安全,数据安全,隐私安全。在数据传输与存储的过程中,较好的保护与溯源措施。在管理政策上,随着业务部门对数据管理的要求不断地提高,要加强相关数据安全的工作高度。在基础设施上,完善网络安全设备购置。在数据管理监控上,需要在数据资源中心中对每个数据资源都进行量身定制的精细化安全配置与管理,使用加密技术保障数据安全,并通过安全监管与体系的运作进行相关政策保障,同时加强使用人员的信息素养与安全素养的培训。

2.4  夯实有效数据查看与共享

打造数据服务生态圈通过数据采集到数据公布共享一整套地从底层到应用到服务,为学校数据服务与数据管理提供价值转化的直接渠道。吸引各业务相关人员使用该平台完成各种数据调研、数据共享、数据管理等业务,提高平台黏着力,让更多的人员参与到数据的挖掘与共享的生态圈中,实现智慧校园数据价值。

2.5  明确数据权责

数据治理除了完成多类型、多源头数据采集之外,提升高校数据质量,为高校数据治理提供高质量的数据资源。利用大数据治理平台提供安全手段防止非授权用户的非法侵入、攻击,避免操作人员的越级操作,强化各部门权责范围,加强高校数据资源整合与积累,但距高效智能分析还有一定差距。

3  高校数据体系构建

利用大数据平台对于高校现有的结构化、半结构化,非结构化数据进行转化成数据资产,基于“抽取-转换-共享-反馈-处理”的数据治理模式与“需求-沟通-配置-整合-分析”数据服务模式,提升数据质量、维护数据安全、保护个人信息隐私、保证数据的完整、高效数据共享,建立数据使用与服务保障功能,构建数据治理与应用服务相结合的全生命周期生态治理体系,搭建数据治理四层次模型,如图1所示。

3.1  數据创新应用层

以企业服务总线(ESB架构)为基础,利用各类面向服务架构(SOA接口),搭建智慧应用超市,将数据资源与应用端实行深度解耦合[9],共享可靠的数据资源,使得个人或三方公司在此基础上开发发布服务高校运行、决策的创新应用。

3.2  业务服务层

利用已搭建的数据模块,组建共享服务平台,对有源数据资源进行聚合封装,对学校现有的业务流程进行重构,优化。并利用ESB框架,开发SOA服务接口,实现数据高速流通,以服务为导向再造业务流程,对已解耦合应用深层次融合,构建高校智能接口服务云。

3.3  实体数据层

利用分布式计算和储藏的技术,利用大数据互联平台,对各种原始数据进行信息抽取、清洗、存储、转化,并利用ESB总线的各种数据服务,按国标、教标、行标、校标的标准体系要求得到在大数据互联平台中的各种业务资源数据,包含了基础数据仓库、各类主题仓库、各类指标数据仓库,如图2所示。

3.4  基础设施层

充分兼容智慧校园未来的大数据IT发展方向,涵盖了物理机资源,虚拟机资源,以及其他的实体机资源。平台既能适配基于基础架构大数据IT底层架构,也能满足以物理机为基础的物理底层架构。

以上述四大核心层为基础,搭建好大数据平台的标准、规范、制度建设,完善的安全运维管理系统建设,大数据平台中数据的全生命周期安全管理、使用与审计的三个维度。就可以提供业务驱动层,建设即时通信平台、开放平台和中间件工具。再以业务驱动层为基础,衍生出智慧创新服务应用支撑智慧校园发展,如消息服务应用、智慧大脑应用、分析服务应用、评价体系应用,等等,还需要多学习、多交流,不断进行探索创新与研究,完善高校的决策能力,更智慧的服务于师生、最终用户,提高智慧校园的信息服务能力,助力高校教育现代化深层次变革。

依据高校自身实际制定的数据执行标准,应用大数据平台的自动化的数据采集、整合、共享、分析工具,通过业务应用创新增强数据治理功效,提高数据流转能力,并依照“高校数据深入融合、业务流程重组再造”的原则,业务服务从“被动化”向“主动化”转变,数据管控从“孤岛态”到“服务态”的转变,师生管理从“简单化”向“多元化”转变,科学研究从“粗略化”向“精准化”转变。并设计建设高校数据共享交换功能体系,实现不跨部门的业务系统数据的融合和共享,将大数据平台标准库中的符合共享条件的十万条以下的数据以API接口形式发布,授权给需要数据的业务系统或开发者使用;引入流程重组和可视化的分析工具,以标准平台清洗好的数据资源为基础,为第三方数据需求者提供服务。

建立健全数据治理机制与体制、组织机构运营与管理的协同保障体系,围绕“数据采集→数据存储→数据清洗转换→数据共享→数据分析挖掘→数据创新应用”的全生命周期治理流程开展,经数据集成工具、数据湖、数据标准库、元数据库、数据质量平台、数据资产平台、数据质量平台、数据安全监控的协同作用,使高校数据价值最大化。

4  结  论

技术的持续更新换代,给高校信息化的信息系统发展带来了挑战,网络安全是保障高校教育信息系统运行的基础,数据治理需注重网络安全。本文针对高校数据治理过程中出现的问题,给出了数据治理建设的建议,对将要实施数据治理项目的专业人员有一定的启示作用。高校需更多的专业人员参与到数据治理的生态圈中,通过大数据中台深入挖掘和处理,加强资源能力整合与沉淀,提高数据安全,强化校务的管理,实现智慧校园数据价值。

参考文献:

[1] 佚名.审时度势精心谋划超前布局力争主动  实施国家大数据战略加快建设数字中国 [N].人民日报,2017-12-10.

[2] 蔡翠红,王远志.全球数据治理:挑战与应对 [J].国际问题研究,2020(6):38-56.

[3] 俞可平.治理与善治 [M].北京:社会科学文献出版社,2000:270-271.

[4] 安小米,许济沧,王丽丽,等.国际标准中的数据治理:概念、视角及其标准化协同路径 [J].中国图书馆学报,2021,47(5):59-79.

[5] 教育部高等学校图书情报工作指导委员会,高等教育文献保障系统 (CALIS) 管理中心.高等学校图书馆数字资源计量指南(2004年) [J].大学图书馆学报,2004(3):90-89.

[6] GUPTA U,CANNON S. Data Governance Frameworks [M].Bingley:Emerald Publishing Limited,2020.

[7] 刘露,杨晓雷.新基建背景下的数据治理体系研究——以数据生命周期为总线的治理 [J].治理研究,2020,36(4):59-66.

[8] 杨强,张辉.等保背景下高校内部数据治理的问题现状与数据安全提升探讨 [J].长江信息通信,2022,35(2):161-164.

[9] 张辉,李健明,杨强.大数据视角下高校数据治理体系研究与实践 [J].中国高等教育,2022(Z2):16-18.

作者简介:杨强(1984—),男,汉族,江苏盐城,工程师,硕士,研究方向:通信与信息系统、通信网络、网络安全。

收稿日期:2022-12-07

基金项目:中国高校产学研创新基金(2020ITA02010)

猜你喜欢
数据治理数据质量数据安全
云计算中基于用户隐私的数据安全保护方法
建立激励相容机制保护数据安全
大数据云计算环境下的数据安全
基于本体的企业运营数据治理
云端数据治理初探
浅析统计数据质量
金融统计数据质量管理的国际借鉴与中国实践
浅谈统计数据质量控制
大数据治理模型与治理成熟度评估研究
大数据时代城市治理:数据异化与数据治理