基于大数据的高校疫情防控系统研究与实践

2022-07-12 04:53刘勇郝璐瑶赵文涛刘佳
微型电脑应用 2022年5期
关键词:师生防控人员

刘勇, 郝璐瑶, 赵文涛, 刘佳

(南京航空航天大学, 信息化处, 江苏, 南京 210016)

0 引言

2020年,一场突如其来的新冠疫情(COVID-19)迅速席卷全球。疫情爆发一年多以来,给包括高校在内的整个社会带来了严重的影响。由于疫情的蔓延及防控措施,给交通、餐饮、娱乐等产业带来了直接冲击,对中国经济增长带来重要的影响,同时新冠肺炎疫情在海外呈快速蔓延态势,对美国、欧盟、日本等世界主要经济体经济增长带来严重打击,全球经济遭遇了上世纪30年代大萧条以来的最严重衰退。高校也不能在全球疫情爆发的大背景下独善其身,纷纷延迟开学,通过“网课”,实现“停课不停学”,并通过一系列信息化防控手段,实现了精准防控。新冠疫情的爆发在一定程度上促进了信息技术和在线教育的普及推广,并助推了大学治理能力和效能的提升。

2020年来,全国疫情虽然得到了有力控制,但形势依然严峻复杂,包括高校在内的社会各种单位不能有一丝懈怠,必须按照中央有关部署全力做好疫情防控各项工作。

1 传统疫情防控及大数据在疫情防控中的应用现状

传统防疫一般采取“人海战术+手工表格+手工确认+逐级上报”的手工作坊式手段,往往造成通传不畅、数据“打架”、组织低效、管理困难等突出问题。使用QQ、微信群等传统手段,无法确认学生是否已读,辅导员班主任需要逐个确认,尤其邻近开学,通知越来越多;疫情采集依赖手工表格、问卷工具,不匹配学校管理模式,效率低下,统计繁琐;校门入口管控中,通过手工确认学生身份信息,手工体温检测、效率低、易聚集,同时也造成校外人员出入管理无依据、风险大,容易引入疫情风险;以上都是传统疫情防控存在的突出问题。

大数据分析是指对规模巨大的数据进行分析,通过大数据分析挖掘人物事件之间隐藏的关系。大数据具有数据规模巨大、产生高速、表现形式和内容多样等特点。早在2020年1月,工信部即召开疫情防控大数据支撑服务工作调度会,提出“运用大数据分析,加强联防联控,实现精准施策,确保疫情防控科学有效推进”。

当前,大数据已经被广泛应用在疫情防控过程中,并起到显著效果。通过电信大数据对用户位置轨迹数据进行多元场景分析,支撑湖北、北京新发地、石家庄等疫情中高风险地区密切接触人员流动情况分析,服务疫情态势研判、疫情防控部署。浙江等省份通过充分运用“大数据+网格化”手段严密开展全面排查,精准滚动排摸相关人员,落实具体管控措施。全球健康药物研发中心联合清华大学通过人工智能药物研发平台和大数据分享平台,加速新型冠状病毒药物研发。重庆市、黑龙江省等各省市公安局运用公安大数据服务支撑疫情防控工作,实现资源汇集、手段集成,编织起了一张牢固的数字化疫情防控网。大数据模型还为政府决策复工复产提供科学参考。

2 需求分析

由于本次疫情爆发正处于学生寒假的特殊节点,这对高校各项防疫抗疫活动的开展造成了一定的困难,例如师生的健康状况难以把握、师生的实际地理位置难以确定、开学如何调度返校批次、远程实时监控师生在校健康状况以及在公共场所如何追踪学生轨迹位置等。

高校师生遍及全国各个省市直辖市,地理跨度大、疫情严重程度不一、远程沟通不通畅,使得学校难以准确把握师生健康状况;疫情期间,部分师生的行动轨迹难以界定,无法确定其活动半径,存在潜在感染和被感染风险;开学时,人流量大,交叉感染风险高,解决在尽可能不影响教学活动的同时实现学生的安全入学的问题,十分迫切;校园里,人员密度大,传染风险高,一方面对全校师生的健康状况的实时监测尤为重要,另一方面要对学生的行为轨迹和位置进行追踪,有助于对风险群体的追溯。

根据本次新冠疫情的特点以及高校实际的校情和学情,高校迫切需要构建一个包含学生入校、在校和离校的全周期大数据系统。该系统一方面要借助校园信息化设备采集数据,另一方面还要打破校园各业务部门的数据壁垒,实现对学生数据的融合对齐、清洗加工以及应用等,该系统可以为学校的疫情防控增利助益,有力保障广大师生们的身心健康和教学科研工作的顺利开展。

3 系统设计

3.1 系统总体架构

基于大数据的高校疫情防控系统通过获取数据源层的数据,进行统计分析和挖掘,给学校师生提供数据应用服务。系统主要由数据源层、服务层和展现层组成,具体设计架构如图1所示。

图1 基于大数据的高校疫情防控系统总体架构

数据源层主要用于存储各类校园数据,主要涵盖校园数据中心主数据库,包含办公、人事、教务、研究生、学工、保卫、后勤等业务系统以及日常填报的身体健康状况数据、地理位置数据、接触者数据等。接着对数据源层的数据进行初步处理,按照类别整理和分成公共基础数据和业务主题数据。

服务层的作用在于对数据源层的人员、地理、疫情上报等数据进行抽取、分析、转换,并将分析、挖掘后的数据提供给展现层。根据业务应用的需求提供微服务形式的数据服务。数据抽取转换的最终目标通过对数据预处理,生成顶层业务分析和挖掘分析建模所需的数据集。

展现层主要将服务层产生和存入的数据进行可视化展现,通过Web页面、大屏和移动App等形式,为疫情防控决策提供各种大数据支持服务。

3.2 数据采集

该系统采集、存储各类校园数据,包括数据中心主数据库、业务系统数据以及疫情防控系统数据等,包括学生抵校时采集的学生实时体温数据,每天收集学生当天的体温数据、不良症状数据。对体温过高等异常症状的重点对象,还要收集更多、更细致的生理健康数据。学生上课、就餐等群体活动的位置数据也会被采集等。数据采集包括接口测试、传输监测、质量监控、采集统计和日志管理等。

各类数据采集接入是大数据应用过程中关键的环节,除了需要大量的数据格式调研,还需要针对各类系统产生的数据量、数据存储方式、数据交换实时性等具体情况,设计不同的接入方式。一般情况下,为了不影响原有系统运行,将这些系统中需要共享交换的数据拉取到视图中,并开放视图的对外访问权限,之后便可由数据交换系统进行数据的抽取和转换。由于对接系统较多,需要通过ETL工具进行数据抽取(Extract)、转换(Transform)、加载(Load),并依据相应的数据标准和规则对其处理和整合。

3.3 数据清洗

由业务系统获得的数据,存在各种问题,数据质量不高,如存在缺失值、存在重复记录、编码不一致以及数据难关联等,一般不能直接使用。只有先经过清洗处理,数据才能够为实际应用提供坚实基础。由于数据质量问题多样,一般综合采用多种方法对数据进行清洗,以期兼顾速度与效果,清洗方法如图2所示。

图2 数据清洗方法

早期业务系统建设存在“重功能、轻数据”的现象,在疫情防控系统对接的各类系统当中,常见的数据问题有下面两种。

(1) 数据质量不高。由于采集方式不同、采集手段落后,数据质量参差不齐,数据录入不准确,更新不及时,存在缺项、丢失、无效、空值、定义不明晰等问题,低质量数据不断沉淀,数据的完备性、准确性存疑,难以充分高效地利用。

(2) 数据共享不充分。一方面,由于很多业务系统由院系和部门自行建设、自行管理,没有纳入数据中心进行统一管理,数据中心无法获得全量、全过程数据;另一方面,人员和组织机构编码等信息往往各系统仍相互独立,研究生、教务系统、组工系统等系统组织机构未沿用人事系统统一编码标准。这些都为数据共享带来了严重阻碍。

3.4 数据呈现

数据展现层负责对数据进行可视化展现,展现形式包括Web端、移动App以及展示大屏等,用数据说话,为决策提供支撑。数据服务层会按照各类使用场景,抽取各业务系统的数据信息,将不同系统的数据根据既定的逻辑关系进行分析、整合和处理,通过数据集成交互、数据实时抓取和高分渲染等技术手段在数据展现层给予呈现。微服务架构的使用有效降低了数据展现层的重复性工作,实现了系统之间的松耦合。

4 系统实现及效果分析

4.1 疫情跟踪大数据

疫情跟踪大数据主要包含疫情实时播报、健康情况展示、健康跟踪、人员跟踪、严控部门情况展示以及历史数据查询等模块。疫情跟踪大数据以新冠疫情为抓点,对采集的数据包括体温等师生健康、位置等行程数据,通过分析、整合和处理,实现对重点关注人群的实时追踪,使疫情可防可控。

(1) 疫情实时播报。系统每1小时抽取最新疫情上报数据,时刻关注疫情发展,如图3所示。该部分包含本校总体疫情趋势展示,并且进一步细分为学院学生健康状况信息和各职能部门员工的健康信息。

图3 疫情实时播报图

(2) 健康跟踪展示。健康跟踪通过汇总各院系学生的健康数据,主要以人员总体体温分布、异常体温趋势曲线、异常症状人员的院校分布、上报感染人数曲线、上报疑似感染人数曲线、异常症状人数曲线和接触感染者人数曲线的形式予以展现,便于主管部门有效把控,为防疫措施的决策和部署提供数据支撑,图4展示了它的部分功能。

图4 健康跟踪展示图

(3) 人员跟踪展示。人员跟踪主要展示各学院、各职能单位的学生或教职工的当前所在地理位置,按位置划分为:在湖北、在宁不在校、非在宁以及在校等4类,同时以热度图的形式展现人员的空间分布情况,如图5所示。

图5 人员跟踪展示图

疫情跟踪大数据根据师生每日上报的健康信息,挖掘数据趋势,分析学校总体疫情防控形势,重点开展对确诊/疑似/隔离人员、湖北/武汉外出史、湖北/武汉人员接触史、密切接触人员等重点人员的大数据分析,实现了全校人员信息的可查和可追溯。学校各部门根据疫情跟踪大数据分析结果,可以全面掌握当前面临疫情形势和发展趋势,为做好疫情防控工作、全力阻断传染源,提供科学决策支持,同时掌握全校师生分布情况和返校趋势,为做好复学各项准备工作提供依据。系统上线后获得各个部门高度关注,为学校快速掌握师生健康实时状况及动向提供数据保障,为做好师生返校保证工作提供了支撑。

4.2 学生返校大数据

学生返校是校园疫情防控的重点,需要掌握学生返校申请概况和各学院、各生源省的返校申请概况,重点对来自中高风险地区且已经审批通过的返校人员进行关注;入校过程中重点要对学生体温状态、健康状态以及人流量状态进行跟踪。

学生返校大数据主要有人员分布展示、返校学生态势、返校学生实况、行程追踪展示以及返校学生行程追溯。采集了教职工和学生每日填报数据、返校申请数据、各校门门禁数据以及行程轨迹数据等,并根据学生ID实现跨表数据关联。返校大数据可为相关业务部门学生返校工作的计划、组织和调度等提供有效数据支撑。

(1) 返校学生态势。返校学生态势可以按照不同校区动态展示申请学生数、已返校学生数、重点关注学生数以及各年级群体的地理分布情况等,并进一步划分为培养层次、性别以及毕业年级等。返校学生态势,可宏可微,有助于学校统筹安排和合理调度整个学生返校工作,减少疫情管控压力。页面展示如图6所示。

图6 返校学生态势图

(2) 返校学生实况。返校学生实况可实时的展示学生返校过程中的真实状况,包括每个校区累计的审批人数、返校人数、异常人数和按时间统计的返校人数趋势,按学院统计的审批人数、返校人数、异常人数和返校率等指标,并可以知识卡片形式动态展示当前时刻每个校门出入道闸的学生信息,如图7所示。

图7 返校学生实况图

(3) 返校行程追溯。可通过学号和工号、列车班次来查询师生员工的行程信息。通过输入学号等,可以查阅该对象基本信息,如健康状况、同行信息、历次疫情上报信息以及轨迹碰撞信息等,还可以通过输入列车班次查阅列车信息以及同次搭乘该列车的人员信息等,如图8所示。

图8 返校行程追溯图

5 总结

针对高校新冠疫情防控中存在的数据规模大、数据乱结构类型多、数据壁垒、所在地理位置和健康状况数据难实时获取、难归结等问题,构建了包含学生入校、在校和离校的全周期校园疫情跟踪和返校大数据系统。该系统能互联学校各业务系统的数据资源,并通过任务定时调度机制,实现了实时、准确获取各项数据,微服务的架构采用实现了业务组件化和服务化,降低了系统的耦合性。系统上线后,学校各部门可以根据分析结果,全面掌握当前面临疫情形势和发展趋势,为做好疫情防控工作、全力阻断传染源,提供科学决策支持;同时掌握全校师生分布情况和返校趋势,为做好复学各项准备工作提供依据。

猜你喜欢
师生防控人员
配合防控 人人有责
初中历史教学中师生的有效互动
猪常见腹泻病症状及防控
师生讨论改病句
守牢防控一线 静待春暖花开
防控疫情 从我做起
师生过招,你敢接吗
再来一次,这太有趣了!
跟踪导练(四)
麻辣师生