大数据技术在高基报表工作中的应用

2020-06-10 07:41吴昊
电子技术与软件工程 2020年4期
关键词:报表工作

吴昊

(扬州大学信息化建设与管理中心 江苏省扬州市 225009)

高等教育统计工作,是一项透析高等教育现象以进一步探索教育发展规律的重要工作。高基报表填报时会存在填报效率低、数据质量差等问题。大数据技术的出现,不仅能够减轻统计员的工作压力,而且易于数据后期的追溯和利用。

1 高基报表填报工作的概述

高基报表的填报工作一般首先由各省的教育主管部门召开工作布置会,高校参会人员传达会议精神。之后,高校的各部门根据自身情况填写相关报表。最后,由专门统计员登录教育统计软件或者平台进行填报、核查与上报。通过对高等教育事业基层统计报表的整合与分析,为制定教育政策、编写教育发展规划提供了直观的依据。高基报表填报涉及高校内的各类信息,主要分为以下几个方面,如图1所示。

在管理学中有个不等式,即100-1≠99,100-1=0[1]。在统计工作中,这个细节不等式也有对应的解释,1%的偏差可能导致整个工作的偏差。数据填报时,由于高基报表填报的表格数量繁多,对每个数字的精确度要求极高,填报的数据很容易存在逻辑性和经验性问题。逻辑问题是指在填报过程中出现的逻辑错误,例如数据的统计运算错误、数据誊写错误等。经验错误与逻辑错误不同,是指按照常规的教育经验理解,可能存在的问题。例如在填报系统里,认为招生数应该小于或者等于一年级在校生数。然而在现实填报过程中,由于某些新生因故办理了保留入学资格手续,使得在校生数小于招生数。类似问题的存在,需要统计员仔细分析,这在一定程度上增加了统计员的工作量。

从互联网+,到智能+,高校逐渐建立起各类数据系统,如智慧学工、人事系统、资产管理系统等。但是,高校内部的数据系统仍存在以下几个方面的问题:首先,各部门间资源不共享,同一个含义的数据如果来源于不同的归口部门,会存在数据不一致的情况;其次,数据的存储管理不规范,导致了过往数据的大量丢失。而高基报表要求能够追溯到以往的数据,即有清晰的台账与记录,这给统计人员带来了巨大的工作困难;再次,伴随着海量的半结构化数据、非结构化数据的产生,能否高效的分析出这些数据,也对统计工作提出了新的挑战。

图1:高基报表填报内容结构图

图2:高基报表填报分解图

图3:业务系统逻辑图

2 大数据技术在高基报表工作中的应用

传统的高基报表填报模式一般可分为以下几个步骤,如图2所示。但是在填报的过程中,容易出现数据不一致、后期追溯难等问题,本文利用大数据技术,对高基报表的填报工作进行探讨。

大数据关键技术包括采集与预处理计算技术、存储与管理技术、可视化计算技术、分析与挖掘技术等。为改善数据质量,应利用采集与预处理计算等技术,对数据进行治理。

国内已经有部分学者针对高校的数据治理模型与框架做出了相应的研究:包冬梅等参考了以数据管理为主导的DAMA等框架,通过CALib模型,对数据治理的成熟度评估进行了初步的探讨[2];赵安新[3]充分利用互联网+背景下的大数据技术,从高校数据融合的角度研究了高校数据治理的框架;顾立平[4]等指出,图书馆执行相关数据策略能够支持数据治理工作;从技术层面、制度层面等,魏楚元[5]等人对高校的数据治理构建了相对完整的治理框架。

高校的数据治理需要解决以下几个关键点:首先,针对高基报表的数据填报工作,源头数据是关键。只有源头数据准确,最终得到的数据才会真实、有效。在数据收集前期,可对学生数据子集、人事数据子集、教学资源数据子集、资产情况数据子集等仔细划分,确定职能部门,找准源头,解决数据流向混乱的问题。其次,将获取到的数据建立统一的编码标准与规范,实现资源的互联互通。例如都柏林核心元素集,此元素集就是一个致力于规范Web资源体系结构的国际性元数据解决方案。同样的,高校的数据治理也应从实际情况出发,制定出自定义的编码规范,如学号、工号、单位部门编号等规则。最后将数据进行清洗、处理,形成统一数据标准的平台。业务逻辑图如图3所示。

在前期数据的预处理和存储工作完成后,可在一定程度上整合校内数据资源。但高校必须清楚的认识到,数据应用才是校园信息化智慧建设的本质。通过导入报表数据,将教育数据用折线图、饼状图等方式呈现出来,如图4所示。大数据可视化计算等技术帮助校领导了解管理与教学过程中存在的问题,利于高校管理服务协同化、决策应用科学化。

当然,大数据的应用不限于可视化模块的展示,其价值也体现在预测功能。通过计算和整合,将学生、教师、资产等数据转化为高校综合办学条件的12个指标数据。对得出的近三年各项指标加以分析与对比,构建预测模型,从而预测出下一年度的指标数据。若预测数据超过合格指标范围,则进行预警提示。该功能不仅能让校领导更深层次的把握高校的基本情况,对今后的发展做出合理的统筹与规划,而且为高校追求高层次发展提供了有力的支撑。

3 5G技术助力数据填报工作

近年来,4G技术在教育、医疗等领域都发挥着重要的作用。但是,随着科技的发展,传统的4G已无法承载网络激增的需求。5G与4G不同,除了高速率、低延时、高可靠性等特性带来的优质体验,还允许更多的设备高速安全的连接在一起。可见,通过与大数据等技术紧密结合、相互渗透,5G的出现将构筑一个“智能+”时代。同样的,5G的发展为复杂的报表在移动端实现高速下载、在线查看提供了可能。对于关键数据,不仅可以实现查询与分析功能,当发现填报错误时,还可以修正数据,并实时同步至PC端,使得填报方式更加灵活、方便。

图4:数据可视化界面图

4 结语

通过将大数据的相关技术运用于高基报表的数据填报之中,一方面能够实现数据的共享与复用,解决上报数据差异问题,提高数据填报质量;另一方面,通过对数据的分析和预测,能够辅助校领导科学决策,盘活学校各项资源。而对于高校,利用大数据技术获得的成果不仅仅用于高基报表的填报,更可用于其他工作。因此,高校应掌握数据应用的自主权。从事高校信息化工作的人员应学会使用相应的工具,熟练的进行数据清洗和处理,并利用相关技术对数据进行深度挖掘。让高校既是数据的“生产者”,也是数据的“管理者”,从而让数据的治理与应用成为常态化、可持续的工作。

猜你喜欢
报表工作
LabWindows/CVI中Excel报表技术研究
公司集团合并报表的编制
从三大报表读懂养猪人的成绩单
不工作,爽飞了?
镇长看报表
选工作
厌烦工作了该如何自救
月度报表
月度报表