数据驱动教研改进的数据挖掘思路和技术

2019-09-10 00:04林志春
少男少女·教育管理 2019年11期
关键词:数据统计数据处理互联网

林志春

摘要:随着互联网的广泛应用和物联网的成熟普及,教育信息化程度不断提升,教育教学过程中大量的过程数据被记录和存储,形成教育大数据。教师要在传统的教育教学经验上,学会挖掘教育大数据,开展基于教育实证和数据分析的教学研究工作,对明确的教育对象建立精准的任务目标,制定精准的方法措施,推进管理精准化和决策科学化。

关键词:数据处理;数据统计;互联网

2019年2月,国务院颁发的《加快推进教育现代化实施方案(2018-2022年)》中提到,推进教育现代化要创新信息时代教育治理新模式,开展大数据支撑下的教育治理能力优化行动,推动以互联网等信息化手段服务教育教学全过程。

按DIKW体系理论,数据是未被加工解释的原始素材,而信息是对数据的解释,是被处理后、具有逻辑关系的数据,只有对数据进行过滤、提炼及加工,才会产生有价值的信息。因此,建立数据思维、掌握必要的数据处理技术,是每位教育从业者的必备技能。笔者借助深圳市教育局组织的“中小学青年教师教学能力大赛”的活动数据,通过EXCEL的数据透视表(Pivot Table)工具进行数据统计和分析,探讨基于教育数据改进教研活动的数据处理思路和方法。

一、数据收集和数据清理

由于本次处理的数据来源是上级部门网站发布的Word文档文件,不利于数据统计和分析,所以数据收集工作主要是数据格式的转换,即将Word文件中的获奖名单内容复制到Excel文件的工作表中。

数据清理是对原始数据进行处理,解决数据的完整性、唯一性、可靠性、合法性和一致性,以供后续的数据统计和数据挖掘使用。在本例中,由于获奖名单表格中有合并单元格,导致在转换为EXCEL格式过程中,部分数据不完整,因此需要将其合并的单元格拆分还原,并将信息补充完整,即补充每条获奖信息的所在学段(“学段”列)、所属学科(学科列),以及所属区域(“区/直属”列)等信息。

数据清理还有一项重点工作,就是保证数据的一致性。在本例中,教师所属学校的单位名称必须保持一致。例如,要将获奖信息中“福田区荔园小学”和“深圳市福田区荔园小学”的学校名称统一为相同的名称。这样才能确保学校教师获奖情况统计的准确性。

二、明确需求和数据统计

数据清理完成后,我们就可以开始数据统计操作。数据透视表是Excel统计数据最简单好用的功能,插入数据透视表后,只需要简单地将数据的字段拖拽到指定的行、列区,就能够实现数据的自动排序、筛选和分类汇总,生成丰富的数据分类统计表。下面,以OFFICE2010为例,介绍Excel数据透视表的常用操作方法。

(一)统计各区获奖人数的方法

通常情况下,为了解各区教师的获奖人数情况,需要按获奖等级分类,分别统计出各区获得一、二、三等奖的教师人数。在数据透视表中,只需要简单的几个步骤就可以实现。

1.将鼠标定位在整理后的表中,选择“插入”,选择“数据透视表”,在弹出的“创建数据透视表”对话框中,按照默认的选项,直接单击“确定”;

2.在“数据透视表字段”窗口中,将“区属”字段拖放到“行”区,将“奖次”拖放到“列”区,将“姓名”拖放到“∑值”区,默认统计为计算个数,则可以得到所需的统计表,见图3。

(二)统计各区各学段获奖人数的方法

要进一步了解各区各学段的获奖情况,可以生成“各区各学段获奖人数统计表”,操作方法与前面相似,仅在步骤2中。增加一个拖拽操作,将“学段”拖放到“列”区,见图4。

(三)统计各区各学科获奖人数的方法

为了解各区各学科的教研水平,需要统计各区各学科每个奖项的获奖情况。在数据透视表中的操作,步骤1与前面相同,后面操作为:

1.将区属、学科和教师分别拖到“列”“行”和“∑值”区,生成“各区各学科获奖人数统计表”。由于字段放在“行”区和“列”区的效果一样,通常将字段中不同的数值比较多的字段放在行区,在本例子中,学科字段的不同数值比较多,所以放在“行”区。

2.为方便观察和比较各区各学科一等奖的获奖情况,所以将“奖次”字段拖到“筛选”区,生成可按获奖等级筛选的“各区各学科获奖人数统计表”。此时,可以通过单击选择表格左上角的“奖次”筛选,分别统计各区各学科的一、二和三等奖人数。

另外,为方便观察生成表格的数据,可以设置数值条件,显示不同颜色。例如,选择“数据透视表”,然后在菜单栏中的“条件格式”中设置“大于l”,并将满足条件的单元格填充为红色,见图5,其中红色单元格表示对应区和学科的一等奖人数超过1人。

(四)统计全市各个学校的获奖人数的方法

可以用类似的方法,见图6,将“学校”字段拖到“行”区,将“奖次”字段拖到“列”区,将“姓名”拖到“∑值”进行“计数”,生成“各学校的获奖情况表”。

三、数据分析及实践应用

借助Excel数据透視表,通过简单操作,就可以快速生成各种分类统计表,呈现出丰富的、有价值的信息。例如,根据各区各学科获奖人数统计表(图5),各区的学科获奖情况一目了然,结合平时调研了解的情况,可以推选出具有学科优势的区域,开展学科区域教研经验的总结推广活动。另外,在选送优秀选手参加高级别比赛时,区级教研团队的强弱也是重要的参考依据。再例如,借助各学校获奖人数统计表(图6),再结合实地调研,对获奖人数较多的学校,总结梳理其在教师引进、教师培养、科组建设和教学研究等方面的优秀经验和做法,实现整体提质增效。

通过本文的数据分析应用案例,我们明确了基于数据驱动教研改进的思路,即随时随地采集和记录日常教育行为相关的过程数据,再根据具体教研需求,对已采集的数据进行筛选、分类和统计,得出基本情况,然后结合实地调研,针对性地了解情况,检验数据分析的结果,再将结果应用到实际工作中,实现利用数据分析挖掘,提高教研效率和质量。

不过,由于案例中原始数据包含的信息较少,缺乏其他重要的信息,例如获奖教师的教龄、性别、毕业院校等,无法开展更为深入的数据挖掘分析。但是,随着物联网技术的普及和教育大数据平台应用的深入,教育教学过程中将会积累更多数量、更多类型的原始数据,形成真正的教育大数据。期待更多的教育工作者掌握基于大数据的数据挖掘思维和技术,拥有开启教育大数据宝藏的金钥匙。

猜你喜欢
数据统计数据处理互联网
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
基于ARCGIS 的三种数据处理方法的效率对比研究
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
大数据与大数据经济学
视频大数据处理的设计与应用
从“数据新闻”看当前互联网新闻信息传播生态
互联网背景下大学生创新创业训练项目的实施
以高品质对农节目助力打赢脱贫攻坚战