基于大数据分布式处理技术的 教学档案一体化构建与应用研究

2021-02-21 08:51程晨马守明周祎
中国教育信息化·高教职教 2021年1期
关键词:教学档案教育信息化

程晨 马守明 周祎

摘   要:随着教育信息化的不断推进、教育教学改革的不断深化,高校在教学活动中所形成和积累的具有保存价值的文字、图表、音像等不同载体的教学档案材料越来越多。高校教学档案是体现学校教育质量和管理水平的重要标志,是高校工作总结的重要内容和制订工作计划的重要依据。在大数据信息化时代,这些教学档案对改善教学管理、提升人才质量有非常重要的作用,必须进行规范化管理,全面提升其利用率。

关键词:教育信息化;教学档案;大数据分布式处理技术

中图分类号:G647.24 文献标志码:A 文章编号:1673-8454(2021)01-0043-03

随着云计算技术的高速发展以及大数据时代的降临,高校教学档案的储存和管理面临着双重的机遇和挑战。高校的教学档案是在实际教学运行中产生的动态性资料和载体,真实地还原了阶段性的教学状态并进一步反映出教学活动的实际效用。教学档案不再仅囿于简单的储存和佐证功能,它日积月累了海量不同价值和不同类型的图片、表格、印象等管理材料。可以说,教学档案是高校日常进行教学年度总结、顶层设计下一阶段教學计划、持续改进教学管理效果、提升人才培养质量的重要参考标准。如何对现已产生、预先对即将产生的教学档案进行规范化、科学化、信息化管理,对其多维度纵深化全面提升利用效率,给很多高校的教学档案管理人员提出了严峻的挑战。可以说,从长远来看,打通大范围和多元种类的档案信息资源互补与共享、 实行教学档案的信息化是目前档案管理的必然趋势。

大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强决策力、洞察发现力和流程优化能力的,海量、高增长率和多样化的信息资产。要实现大数据分析分布式计算,首先需要搭建分布式计算平台,然后要建立一个分布式计算框架,在此框架下设计分布式计算模型,编写分布式计算程序。[1]借助大数据分布式处理技术,有利于从大量的教学档案数据中挖掘出隐藏着的有特殊关系的信息,更全面、更深刻地了解和掌握高校教学的状况,做出更准确的分析和决策,避免由于信息不完全造成的教学态势误判,从而促使高校提高教学水平。同时有利于高校教学档案管理工作方式的转变,促进教学档案管理从以往侧重记录和保管转变为教学档案的综合高效利用,充分挖掘教学档案的潜在价值。

一、大数据背景下的教学档案一体化构建面临的多重困境

信息化档案管理人员队伍水平参差不齐,而教学档案的有效管理和开发利用依托于管理人员的专业水平。现如今许多高校的档案管理人员多为教学秘书作为兼职人员,并不是专业的档案管理出身。教学秘书的工作繁芜多杂,疲于应付日常的教学管理活动。无论是从精力上还是专业素养方面,都与专业档案人员存在相当大的差距。教学管理信息化对从业人员的档案管理和计算机专业辅助能力都有相当高的要求。如果不是专业人员进行管理,那么教学档案产生、维护、管理、更新、利用的全过程化环节都无法发挥档案的最大效能;更容易出现收集不及时、材料遴选标准缺乏、储存地方不规范、依赖于传统纸质档案的管理困境。同时,我国尚未建立专业档案职业资格认证制度,对于档案从业人员缺乏统一的从业标准,也成为掣肘我国高校教学档案信息化建设的因素之一。[2]

1.多数院校对档案价值重要性认识不够,教学档案管理机制不健全

无论是从校级层面还是二级学院层面,均对教学档案价值重要性认识不够,简单认为教学方案是教学运行后自然产生的必然资料,仅为上一阶段教学环节的总结,与整体教学环节的指导性和应用性关联不大。从意识上不重视对现已产生的教学档案深度利用和开发。一方面,学校虽然具备档案馆,但是收集的材料多种多样,并非精细化专门化的教学档案。学校档案馆倾向于按照年度收集各部门的已生成材料,涉及行政、人事、学工、教学、后勤等材料。材料多杂,但是对教学管理活动价值不大。没有成立专门的教学档案管理组织机构,更有许多高校为了迎接教学审核性评估,临时成立教学档案的检查小组,对于检查的内容,不管是二三级目录是否科学还是储存材料是否具备价值,都难以做出专业判断。另一方面,二级学院作为主要的教学单位,对教学档案的管理缺乏行之有效历久弥新的管理制度和管理办法。普遍重视具体的日常教学活动和人才质量的提升,对有价值的材料如何进行管理意识薄弱。但目前有的地方性高校成立不久,档案的信息化才刚刚起步,信息化档案的收集、整理责任制缺失,管理流程亟待进一步梳理,导致各部门各环节档案信息资源混乱,形成了信息孤岛,给档案信息资源的开发利用带来了进一步的困难。

2.硬件设施设备条件不足,教学档案管理标准不统一

随着互联网技术的高速发展,传统的纸质档案因需要大量专门的储藏空间,或者因为地址变更,导致材料难以完整留存。除此之外, 因为例行教学档案每学年都会产生,如何管理这些纸质档案,比如甄选、储存、维护、收集等环节无不消耗大量人力。这就预示着纸质档案的管理方法逐渐会被数字化方法更迭,数字化信息化教学档案管理趋势即将到来。然而,目前高校教学档案信息化建设中,硬件设备配备上存在不足,软件基础也十分薄弱,档案信息化管理水平较低。[3]

当前,高校的电子档案具有分散碎片化特征,没有统一的管理标准。教学档案的信息化对计算机硬件和网络支撑有很高的要求,否则会难以保存。服务器资源共享建设速度慢,开发利用程度低。同时,电子档案因存储在计算机中,校内师生在访问和查询的过程中,操作不当或者校园防火墙功能不足,很容易让计算机遭遇病毒。给电子档案信息安全带来极大隐患。

二、基于大数据分布式处理技术的教学档案的应用研究

1.教学档案的应用版式

(1)设计教学档案一体化目录模型

教学信息目录是教学档案一体化的基础,可以将教学档案分为综合类、学科建设与实验室建设类、招生类、学籍管理类、课堂教学与教学实践类、学位管理类、毕业生管理类、教材管理类及附录类。主要研究教学档案一体化目录的配置、组合、扩展、版本控制和应用等,支撑教学信息资源的标准化、规范化管理,为深化教学档案应用提供基础支撑。

(2)研究全覆盖的教学档案模型

以一体化目录为依据,以教师和学生为基础,以学校、二级学院、专业系等领域为支撑,研究教学档案分类模型和面向不同领域的教学档案分类模型,支持多级、多域的教学数据加工,最终形成全覆盖的教学档案。

(3)建立教学档案一体化查询报告应用服务

以验证一体化教学档案库为目标,研究以不同主体在多领域、多层级等维度定义多种模版,支持按需配置和快速检索,形成规范、统一的教学档案查询报告,满足各类具体应用的多样化需求。

2.教学档案库构建设计

依据统一的教学档案目录标准,基于教学档案基础库,按照不同档案主体,构建形成不同层级、不同领域的教学档案数据库。技术实现上,一体化教学档案库采用大数据分布式处理技术,经过抽取、处理、存储,满足一体化应用服务需要。

(1)教学档案数据抽取

依据统一的教学档案目录标准,遵循统一的教学信息查询规范,按照统一的教学信息报告格式,基于MapReduce构建大数据的离线抽取处理框架。根据不同档案主体、不同层级、不同领域,在任务调度器中,定义任务调度策略,减少系统瓶颈,将教学档案目录的数据抽取到对应的资源库中。

(2)教学档案数据处理

基于大数据并行计算框架以及流处理框架,采用并行批处理任务,构建不同教学档案主体,多层次、多维度的教学档案主体标识生成算法,教学档案数据关联处理算法,快速构建教学档案库。

(3)教学档案数据存储

按照不同教学档案主体、不同领域及不同层级,分别构建相应的分布式教学档案数据库,支持以SQL、NoSQL等多种方式进行数据的统一存储和联合查询,支撑教学档案高效存储、高并发访问需求。

3.教学档案查询报告模版设计

教学档案查询报告模版可以按照不同层级、不同领域进行灵活配置,既可配置使用统一的、通用的教学档案查询报告模版,可以配置不同教学档案主体的报告模版,又可面向业务领域配置相应的教学档案主体报告模版。同时校级单位可以管理院级及系级单位报告模版,同时支持跨域的模版管理,构建专有的教学档案查询报告模版。

教学档案查询报告模版可以包括报告头、报告主体、报告水印、报告结尾等信息,其中报告头包括报告编号、报告时间、报告二维码信息、报告有效期、报告标题、报告出具单位等内容;报告结尾包括报告的声明、报告说明等信息。基于构建好的各种教学档案库及报告模版,教学档案查询报告可实时生成,文件为经过统一数字签名的 PDF 格式,文件按照统一的报告编号规则,基于分布式文件系统进行存储。报告支持在线验证功能,通过统一的报告编号、报告二维码,可以实现报告真伪实时在线验证。

4.总体业务框架(见图1)

(1)教学档案库目录管理

主要包括目录管理、目录分类管理、目录标签管理及元数据管理。目录管理提供教学档案目录编辑、修改、发布、排序、层级管理、统计分析、快速检索等功能。目录要素包括目录编码、目录标识、共享属性、开放属性、目录描述、目录所属分类等。目录分类管理主要包括新增、删除、修改、查看等功能。分类要素包括建立的时间、状态、编码、所属分级及分类等。目录标签管理通过标签实现档案数据资源目录的分类。目录标签为目录构建多维搜索查询,在繁多的数据资源中快速定位,为快速查询、应用服务等提供了基础。标签要素包括标签名称、标签编号、描述等。元数据是对数据的描述,本课题的元数据管理主要管理教学档案涉及的业务元数据。要素包括基本信息(编号、名称、类型、长度、约束)、限制信息等。

(2)教学档案库分类管理

教学档案库分类主要指按学院、系部、专业等多种分类方式, 通过不同的分类方式,构建不同主体、多领域、多层级等维度教学档案。主要包括教学档案数据资源目录管理、教学档案库资源管理以及教学档案库生成。教学档案数据资源目录管理主要是根据不同主体、不同领域、多层级的业务需求,构建相应教学档案资源目录,为教学档案库数据的生成提供支撑。教学档案库资源管理可对不同主体、不同领域、多层级的教学档案库进行管理,也可对教学档案库数据来源进行统一管理。主要包括教学档案库资源管理及数据源管理。教学档案数据生成是基于教学档案模型,通过数据建模,构建教学档案库,配置相应的数据生成周期,自动同步生成教学信息档案数据。

(3)教学档案查询报告管理

基于教学档案,提供教学查询报告模版管理、院部和个人查询报告生产功能。教学查询报告模版管理主要管理通用模版和特色模版。通用模版适用于根据基本目录信息类生成的报告;特色模版是在通用模版的基礎上加上特色目录信息类。教学档案查询报告是基于规范化、标准化、可配置、易管理的报告格式模版,保证出具的档案查询报告来源一致及格式一致。此外,还提供统一服务接口,可以支撑网络服务和移动服务。

大数据分布式处理技术有利于从大量的教学档案数据中挖掘出隐藏着的有特殊关系性的信息,更全面、更深刻地了解和掌握高校教学的状况,做出更准确的分析和决策,避免由于信息不完全造成的教学态势误判,从而促进高校提高教学水平。

参考文献:

[1]陆红.机器学习分布式大数据分析模型构建方法[J].现代信息科技,2018(9).

[2]王玉新.大数据背景下的高校教学档案信息化建设[J].兰台内外,2018(8).

[3]连伊娜,文佑云.数字化时代高校教学档案信息化建设的策略研究[J].发明与创新(大科技),2018(9).

(编辑:王天鹏)

猜你喜欢
教学档案教育信息化
信息技术与教学难以深度融合的成因及解决途径探析
创新信息技术支撑教学变革