试析大数据分析在学科建设中的应用

2019-09-10 07:22张静刘危杨兵单文波
高教学刊 2019年5期
关键词:绩效评估大数据分析学科建设

张静 刘危 杨兵 单文波

摘  要:随着我国“双一流”建设的开展,学科建设的基础地位愈发突显,但传统建设方法在新形势下面临严峻挑战,无法为“双一流”建设提供长期有效指导。大数据分析具有善于处理大量、异构、多变、关联数据的优势,利用数据挖掘、可视化分析等技术可以在精准掌握教育数据,合理配置教育资源,跟踪监测学科建设绩效,预测学科发展趋势,预警危机专业等方面发挥积极作用。

关键词:大数据分析;学科建设;预警;绩效评估

中图分类号:G640 文献标志码:A 文章编号:2096-000X(2019)05-0001-05

Abstract: As China's "Double First-class" initiative operates, discipline construction is increasingly demonstrating its fundamental role. However, new circumstances have posed a severe challenge for traditional construction ways which fail to provide effective and long-term guidance to "Double First-class" construction. The big data analysis, if introduced in discipline construction, which enjoys its efficiency in handling numerous, heterogeneous, variable and associated data, can play a positive role in a view of the overall discipline construction, more scientific evaluation of performance in discipline construction, early warning of disciplines in crisis and provision of convenient service to collaborative innovation of "government, industry, study, research and practice". In the meantime, more efforts should be made to ensure big data security when they are extracted, applied, saved and released, and to improve the level and capacity of data used in decisions.

Keywords: big data analysis; discipline construction; early warning; evaluation of performance

2015年國务院印发的《统筹推进世界一流大学和一流学科建设总体方案》(以下简称《方案》)中指出:建设世界一流大学和一流学科,是党中央、国务院作出的重大战略决策,对于提升我国教育发展水平、增强国家核心竞争力、奠定长远发展基础,具有十分重要的意义。[1]《方案》指明了学科建设与教育发展、国家进步的关系。学科是“双一流”建设的基础,办大学就是办学科。随着互联网和信息技术的发展,使得用大数据分析描述学科建设动态、预测学科发展趋势、为顶层决策机构提供决策支持成为可能,因此,应尽早搭建为学科建设服务的大数据分析平台,为加快推进我国双一流建设及教育现代化提供决策支持。

一、当前学科建设存在的问题

广义学科建设的内涵包括结构性要素和功能性要素。结构性要素包括凝练学科方向、汇聚学科队伍、搭建学科平台;功能性要素包括人才培养、科学研究和社会服务。[2]

当前学科建设的主要问题包括:

第一,学科布局和结构不合理,学位授予点并不能完全反映社会需求和科学技术的发展[3],学位点、科研基地的建设存在功利性、盲目性。据麦可思研究院近年来发布的《中国大学生就业报告》报道,生物工程、法学、历史、英语、美术、体育等专业已连续几年成为就业榜上的红牌专业。曾几何时,社会上流传着“21世纪是生物学的世纪”的说法,可生物学近年来的就业率却频频下降,甚至沦为十大较低就业率专业首位。培养目标的趋同化致使高校校际间生物工程学科专业毕业生差异性不大、竞争力不明显,导致学生“功能性、结构性失业”现象加剧。不仅生物专业,经历了十余年扩张后表现出明显的颓靡、萎缩之势的专业不在少数。然而这些专业的招生人数、办学规模、学位授予点却在不断增加,暴露出我国学科建设中存在盲目追求指标和规模,却忽视人才培养与市场需求相结合的规律的现象,而这直接关系到高等教育的质量及教育资源的合理配置。邻国日本的例子更是前车之鉴。据日本《朝日新闻》报道:截至2017年7月日本停办或准备停止招收法律硕士的高校多达36所,其中不乏新泻大学、立教大学、京都产业大学这样一些知名高校。而导致这些学校的法律硕士集体停办的一个重要原因就是政府决策的失误。2002年政府预计律师的需求量会加大,于是放宽了律师考试合格率的限制,并加大对法律硕士培养的投资力度,一些院校纷纷开办法律硕士点,但是事与愿违,律师的需求量并没有增加反而减少了,再加之攻读法律硕士的学费比较高昂,一时之间法律硕士成了无人问津的专业,一些院校因为招不到生源而无奈之下停办[4]。给学校和政府造成巨大损失。

造成人才培养与市场需求不相适应的一个主要原因在于:目前的学科建设方法尚不支持前瞻性决策。由于教育数据没有与政治、经济、社会领域的数据对接,因此无法在同一平台对这些数据流进行整合分析,动态观察教育与政治、经济、社会发展之间的联动关系,使决策层不便于高屋建瓴,做出前瞻性决策。师资培养和引进,学生的教育与培养都具有周期性,一旦发现专业设置或学科建设中的不合理问题,可能已无法在短期内消除,而这对于学校、教师和学生本人而言都得不偿失。学科建设需要更具时效性、更有洞见性的分析工具,以实现前瞻性规划。

第二,学科建设绩效评估体制不完善,导致学科建设在培育人才、服务社会方面的价值难以量化。导致这些问题的原因主要有:第一,绩效评价方法上存在局限性。目前学科建设绩效评价的方法主要分为两类:一是指标权重赋权法,二是数据包络分析法。指标权重分析法的缺点在于:受主观因素的影响较大,结论的科学性受到影响。而数据包络分析法的问题在于:所选取的样本量太少,使得求得的效益前沿面不够科学,必然会影响到对学科建设绩效是否有效的评价。[5]第二,由于评估方法的局限,导致评估结果只能从静态上反映出当前学科建设的水平,不能预测学科建设的动态发展。第三,目前的学科绩效评估只聚焦于学科,学科之外的信息被忽视,导致对学科的社会价值的漠视。因此学科外延审视的缺失影响了学科的社会价值计量。[6]

第三,“产学研”协同创新不够,缺乏统筹协调机制,科研成果转化率低等问题,也是当前我国学科建设中存在的突出问题。首先,政府在产学研用结合中的组织协调功能发挥不够,政府的服务机构不健全、服务水平有待提高。[7]其次,科技人员视野受限,创新能力不高,无法适应经济社会发展的重大需求,创新效率低下,高校人才队伍建设与协同创新要求不相适应。[8]

二、学科建设中应用大数据分析的必要性及可行性

(一)大数据分析应用于学科建设的必要性

针对以上学科建设中存在的问题,稳步推进一流大学和一流学科建设,实现“中国特色,世界一流”,必须对学科建设进行前瞻性研究。目前教育决策大多基于事后研判,事后研判固然必要,但对于学科建设总体而言,前瞻性的规划,对于风险管控和优化人才培养质量和科研产出效率,都有着积极意义。尽可能发挥科学研究的领头羊作用,从而带动社会政治经济的发展,并根据社会政治经济发展和人才需求,适时调整人才培养规格、目标和课程体系,就要研究学科建设的规律,影响学科建设效率的重要因素,学科建设和经济社会发展之间的关系,人才培养和社会需求之间的关系等等,这些研究必然牵涉到政治、经济、教育、人口、环境等一系列海量、高速、类型多样的数据流,仅用现有的数据库难以实现前瞻性的设计,只有通过大数据分析才能获取更多智能的、深入的、有价值的信息。大数据分析能用适当的统计方法对海量、高速、类型多样的数据进行整合与分析,从中提取有用信息并加以研究和概括之后形成知识,以指导决策。《方案》要求:以支撑创新驱动发展战略、服务经济社会发展为导向,优化学科结构,强化目标管理,突出建设实效,加快高等教育治理体系和治理能力现代化[9]。《方案》指明了学科建设与经济社会发展的内在联系,要实现《方案》的总体目标,必须加快大数据分析在学科建设方面的应用,以适应“双一流”建设以及国家中长期改革和发展的需要。

(二)大数据分析应用于学科建设的可行性

随着云存储、云计算、互联网、物联网、移动终端等信息技术的飞速发展,使得大数据分析成为可能。大数据分析能够通过对历史数据的分析和挖掘,科学总结与发现其中蕴藏的规律和模式,并结合源源不断的动态流式数据去预测事物未来的发展趋势。[10]这让越来越多的组织认识到大数据的价值。美国普渡大学的Course Signals系统利用数据量化和监测学生的学习状态,其数据来源包括课程考试分数、排名、学术经历以及学生与学习管理系统LMS的互动情况,预测学生在一门课程学习中的表现。2012年美国国家教育部发布了《通过教育数据挖掘和学习分析促进教与学》报告,对美国国内大数据教育应用领域和案例,以及应用实施所面临的挑战进行了详细介绍。2013年1月,德克萨斯大学(UT)推出SAS的可视化分析VA,VA为德克萨斯大学提供了对于学术界的更敏锐的洞见,现在员工们能够很容易就看到不同学院、不同系及课程计划等广泛层面的学术测算指标。这些信息帮助UT能够做出更好的决策[11]。加州大学同样致力于教育数据分析。他们积累有关本科生学习状况、学习经历的调查数据,已经有15年之久,涉及加州大学10个分校中的9所;他们还能通过互联网,从覆盖美国所有高校96%的数据库中提取学生入学前及入学后的相关数据,做相关性分析、趋势展望和政策建议[12]。2015年是中国的教育大数据元年,国内开始对大数据分析在教育领域的应用展开了理论研究,而实证研究则刚刚起步。2017年3月20日——21日“教育大数据应用技术”国际学术研讨会在华东师范大学举行。会议精神认为:教育大数据将重构教育生态系统,宏观层面为教育决策提供科学依据,中观层面推进教学管理和评价的创新实践,微观层面为个性化教学提供精准支持。[13]赵慧琼,姜强,赵蔚,李勇帆,赵艳的《基于大数据学习分析的在线学习绩效预警因素及干预对策的实证研究》表明:学习分析技术可以将大量学生数据转换成有价值的教学信息,通过对最终分析结果的可视化展示,能够发现影响学生学习成绩的关键因素,识别可能存在学习危机的学生,从而为进行学业预警、教学干预、教学决策等服务提供有力支持。[14]尽管目前国内外已有将大数据分析应用于教育领域的理论研究,大数据分析支持下的预警系统设计的可行性也已被证实,但是国内的教育大数据分析多集中在学习分析,对于大数据分析在科学建设领域的应用研究还没有。

本文将就大数据分析在学科建设中的应用及其作用进行分析和展望,旨在为高校学科建设提供有益的参考。

三、如何将大数据分析应用于学科建设

大数据分析普遍应用的方法有可视化分析、数据挖掘、预测分析等。可视化是展示数据的一种方式,可视化能够直观地呈現大数据特点,同时能够非常容易被读者所接受,具有良好的交互性,就如同看图说话一样简单明了。数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含其内的、人们事先所不知的、但又具有潜在价值的信息和知识的过程。如果说可视化是给人看的,那么数据挖掘就是给机器看的。数据的挖掘首先是搜集数据,数据越丰富越好,数据量越大越好,只有获得足够的高质量的数据,才能获得准确的判断,才能产生认知模型[15]。数据挖掘是数据“模型”的发现过程,而机器学习是建模的重要方法之一。机器学习的过程是:将一些已知的并已被成功解决的问题作为范例输入计算机,机器通过学习范例,总结并归纳具有通用性的规则[16]。预测分析是根据可视化分析和数据挖掘的结果做出预测性的判断。只要在大数据中挖掘出信息的特点与联系,就可以建立科学的数据模型,通过模型输入新的数据,从而预测未来的数据[17]。

利用上述技术,第一可以分析学科建设规律,找到制约学科建设和发展的因素,从而合理配置资源;第二可以预警危机专业,控制人才培养的规模和数量,对于可能出现人才过剩的专业,逐步放缓招生人数和师资的培养;而对于可能出现人才紧缺的专业,则适度增加人才培养的数量和师资的培养。将损失控制到最低。

基于上述的各类大数据分析技术,结合学科建设特点,构建了如图1所示的总体应用框架。

首先,整合数据源,搭建“教育大数据平台”。抽取教育部高教司、学位办、科技司、社科司、教育部直属单位、全国哲学社会科学规划办公室、国家自然科学基金委员会、各省市级教育主管部门、科研团体、校级教学科研主管部门等的相关数据作为数据源。对数据源进行处理面临两个问题,一是除了结构化数据以外,还要将图像、视频、课件等非结构化或半结构化数据也整合进来,这对数据关联的发现提出了挑战。二是现有教育数据分属不同的部门管理,存在信息孤岛现象。因此需要通过数据融合技术,对这些结构相异、定义多样的数据进行清洗和转换,使其成为统一的语义学结构,在这种结构下,将数据分解为少量但统一的基本元素。这些基本元素包括:组织、人、物(包括钱)、关系、场所、动作、条件、事件、时间等。经过语义学分解之后,不同数据源的数据就具备了初步的一致性和相似性[18]。然后,通过人为设定的规则体系或人工智能和机器学习的方式,判断不同数据源之间的联系,如一个国家级项目的主持人同时也可以是一个省级项目的主持人、一篇权威期刊的作者、一门在线精品课的主讲人、一所高校的教师,某院、系或者科研院所也可能是国家级重点实验室或基地,某著作或论文可能是某个或几个项目的科研成果等。经过这些步骤,“教育大数据平台”就基本形成了。

在此基础上,就可以对整个学科建设的运行情况进行分析了。比如,可以分析高等教育司某项改革措施或建设工程所造成的影响,某一学科专业的人才流向,交叉学科的发展态势等等,可以根据组织者的要求选择不同“维度、颗粒度和路径”的分析,数据越多、质量越高,就越有利于建立模型,从错综复杂的数据中找到学科发展的规律。这就要用到前面提到的机器学习和数据挖掘技术。通过研究算法,让机器在数据中查找制约学科建设的关键因素,并利用可视化,帮助决策层创建一个描述状况的共享视图,对学科建设中存在的问题本质获取更多洞见,并对需要采取的措施达成共识。

机器学习和数据挖掘除了可以帮助决策层掌握学科建设的发展规律,还可以设计算法将学科建设绩效与资源配置联动起来。根据组织者关于学科建设绩效评价的目的、范围、周期等,确定绩效考核方案,在此基础上设计资源配置方案,联动考核结果与资源配置。构建以师资队伍和科研团队、科研成果水平、人才培养质量、社会服务与文化传承等多维数据为核心的绩效考核模型,为学科建设绩效和资源配置提供技术支持。

另外,根据可视化分析和数据挖掘得到的学科建设规律,可以进一步作出预测性分析,预警危机专业就是预测分析的一个重要运用。传统分析方法是对已经发生的事件进行分析,属于事后研判,而在大数据中,可以通过建立的数据模型,建立一个“智能全景模拟器”,这个模拟器可以帮助我们模拟各种政策和项目工程对整个学科建设及其各个局部的影响,对可能发生的事件进行预估,即预测分析。根据数据挖掘和可视化分析得到的学科建设规律,可以发现制约学科专业发展的关键因素,然后通过建模,预测某項政策措施或社会经济变化会对哪些学科或专业造成影响以及造成怎样的影响。可以把影响程度用得分的形式表示出来,得分越高影响越大,危机程度越高,并根据危机程度给予不同等级的预警。危机学科或专业设置为A、B两类,A类表示需求增长过快,供不应求;B类表示需求放缓或逐渐萎缩,供过于求。例如师生比持续上升,人才市场供不应求、教学或科研绩效高的专业可能预示着人才紧缺,可以归为A类危机专业,根据人才稀缺程度可下设三档或四档等级,等级越高,人才需求越旺,需要调整人才的增量和存量;而就业率持续下降、教学或科研绩效低的专业可能预示着人才培养与市场需求不相适应,存在人才培养过剩的倾向,可以归为B类,同样下设几个等级予以预警,等级越高代表危机程度越高,表明需要调整培养方案,减少招生规模。通过“智能全景模拟器”提供的危机预警,对危机学科专业进行尽早干预,可优化资源配置,减少损失。

当然,模型的准确性不会一蹴而就,还需要对数据的持续观察和对模型的反复验证修改,形成“数据收集→整合平台数据→数据挖掘、机器学习→智能全景模拟→危机预警(可视化)→数据挖掘、机器学习→智能全景模拟……”循环机制,从而不断提高预测性能。

四、大数据分析应用于学科建设面临的挑战

大数据分析固然能解决学科建设中面临的诸多问题,使学科管理和建设走向更加精准化和科学化的道路,但是也要看到应用大数据分析尚存在诸多问题。

首先,数据的筛选问题。大数据时代,人们对数据的认识始终处于不断丰富和完善的过程,高质量、高相关性的数据越多越能做出精准的决策。UT对大数据分析的应用就是一个典型的例子。该校为了减少学生贷款债务增加对办学的影响,这些年来已经采集了大量的学生数据,包括入学和学位数据、学生财务资助数据、课程级别数据等,而数据可视化的新功能,使UT拥有与全州和全国学生债务相比较的有关UT学生贷款来源的信息,以便帮助UT的员工做出更好的决策[19]。科研方面,UT也已经开始采集教师生产力方面的数据,包括不同学院、不同系的学术测算指标,研究经费和学术产出等,并常规性地利用这些数据辅助决策[20]。但这些都只是一个开始,随着大数据的不断涌现,大数据分析技术的推广,需要获取的数据源会不断增加,然而目前工业界处理庞大数据的能力有限,因此对数据进行清洗,尽可能获取高质量、高相关性的数据显得尤为重要,这需要机器学习和智能全景模拟等技术的支持。

第二,安全问题。大数据的挖掘与运用时刻伴随着安全问题,数据安全关乎个人安全和国家利益,必须在数据安全性与隐私性之间找到平衡。随着文化、教育领域公共数据资源向社会开放,大量在线课程的开放,“互联网+教育”模式的发展,教育数据的安全性也面临挑战。数据一旦开放,谁将拥有这些数据?谁又将使用这些数据?科研人员或教师在网站或社交平台发布与教学科研有关的图片、视频或言论时,这些数据是否仍然属于本人,网站和社交平台是否能合法拥有其中的内容,当关闭网站和云服务时,用户是否能将产生的数据带走等,关系到能否在开放数据的同时保护好知识产权、数据的所有权和使用权,个人隐私不受侵犯等问题。要治理学术环境,坚决杜绝盗用数据、利用数据造假、恶意转载、剽窃他人研究成果等行为的发生。不断提高数据安全意识和保密技术,不给假冒期刊网站、非法营利团体以可乘之机。要在从业人员和高校师生中普及安全使用数据的常识和政策法规,让大家建立起大数据时代的安全意识。

第三,数据融合问题。数据融合是一种处理大数据的手段,用于从大数据中发现知识,并按照知识的语义逻辑关联融合形成更接近人类思维的知识,包括数据融合和知识融合2个步骤。数据融合负责将多源数据动态提取、整合并且转化为知识资源,为知识融合奠定基础。而知识融合负责对知识和知识间的关系进行不同粒度的理解,使知识具有不同层次的可理解性和可领悟性,进而方便解释客观现象[21]。就学科建设而言,不同领域、不同学科的科研数据来自不同的数据源;同一专家隶属的机构可能改变,同一专家也可能以不同语种发表成果,这意味着同一专家的信息可能涉及跨数据库、跨语言的融合;不同信息源之间还可能存在隐含的关联信息等。另外,各级、各地区院校在数据的统计、分类、管理上都存在不同程度差异,要将这些数据融合起来进行数据分析和挖掘,还要面临模式对齐、实体链接、冲突解决、关系推演等方面的技术难题。

五、结束语

随着大数据的不断涌现,以及开源软件、云计算等的出现,用数据驱动的管理已初见端倪。麻省理工学院、德克萨斯大学、加州大学等一批知名高校都已聘用专门的数据可视专家和工程师,为决策和研究提供支持。由日本文部省科学大臣认定的“跨学科大规模共享共用信息平台研究基地(简称:JHPCN)”项目,于2010年正式启动。该项目以东京大学信息平台中心为核心,在北海道大学、东北大学、东京大学、东京工业大学、名古屋大学、京都大学、大阪大学、九州大学等八所院校的研究基地配备了超级计算机,形成了“网络式”共享研究基地。项目希望通过超大容量数据平台,解决地球环境、能源、材料、基因组信息、网络数据等大型挑战性课题,为日本学术研究基础的进一步高度化和常态化做出贡献。目前项目组已举办了10界论坛,取得了一些阶段性成果,并于2016年新增了国际共同研究课题、企业共同研究课题、萌芽型共同研究课题,意在强化全球化、产学结合、孵化风险企业的功能[22]。大数据分析已经将触角伸向了高等教育教学、科研、管理等各个层面。不久的将来,用数据驱动的学科建设也定将展现其前所未有的优势。但是技术的进步也对使用技术的人提出了更高挑战,用好数据,不等于一切依赖数据,对学科建设做出科学决策,还要不断提高对数据的甄别、思考和驾驭能力。

参考文献:

[1]http://www.gov.cn/zhengce/content/2015-11/05/content_10269.htm.

[2]梁传杰.论学科建设绩效评价[J].北京科技大学学报(社会科学版),2010(1):160.

[3]谢桂华.关于学科建设的若干问题[J].高等教育研究,2002(5):49.

[4]http://www.asahi.com/articles/ASK7Z5F06K7ZUTIL01K.html.

[5]梁传杰.论学科建设绩效评价[J].北京科技大学学报(社会科学版),2010(1):159-160.

[6]薛玉香,黄文浩.以投入产出比重新审视高校重点学科建设绩效评估[J].中国高教研究,2010(4):39.

[7]朱路甲,刘迪,王宝军.新时期产学研用合作机制创新中存在的问题及相关对策[J].河北大学学报,2011(2).

[8]陈冬梅.基于“产学研用”协同创新的高校人才队伍建设探析[J].高教探索,2013(2).

[9]http://www.gov.cn/zhengce/content/2015-11/05/content_10269.htm.

[10]李金昌.從政治算数到大数据分析[J].统计研究,2014(11):10.

[11]Phil Simon.大数据可视化重构智慧社会[M].人民邮电出版社,2018:110.

[12]龚放.把握学科特性 选准研究方法——高等教育学科建设必须解决的两个问题[J].中国高教研究,2016(9):5.

[13]吴忭,顾小清.教育大数据的深度认知、实践案例与趋势展望——2017年“教育大数据应用技术”国际学术研讨会评述[J].现代远程教育研究,2017(3):11.

[14]赵慧琼,姜强,赵蔚,等.基于大数据学习分析的在线学习绩效预警因素及干预对策的实证研究[J].电化教育研究,2017(1).

[15]陈明.大数据基础与应用[M].北京师范大学出版社,2016:228.

[16]陈明.大数据基础与应用[M].北京师范大学出版社,2016:286.

[17]陈明.大数据基础与应用[M].北京师范大学出版社,2016:209.

[18]王纹,毛彦.数据驱动的管理[M].清华大学出版社,2016:263.

[19]Phil Simon.大数据可视化重构智慧社会[M].人民邮电出版社,2018:112-113.

[20]Phil Simon.大数据可视化重构智慧社会[M].人民邮电出版社,2018:113.

[21]孟小峰,杜治娟.大数据融合研究:问题与挑战[J].计算机研究与发展,2016(2):240.

[22]https://jhpcn-kyoten.itc.u-tokyo.ac.jp/ja/.

猜你喜欢
绩效评估大数据分析学科建设
面向大数据远程开放实验平台构建研究
面向大数据分析的信息管理实践教学体系构建
传媒变局中的人口电视栏目困境与创新
非营利组织绩效评估指标体系研究
武警院校应急救援学科建设存在的问题及对策
论七年一贯制体系下本科学科建设中职业教育的重要性