基于大数据的题库微信小程序的设计与开发

2024-04-06 12:49陈欣苹赵子潇程文莉
电脑知识与技术 2024年3期
关键词:文本分类微信小程序大数据

陈欣苹 赵子潇 程文莉

关键词:微信小程序;文本分类;教育可持续发展;大数据;学习资源管理

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2024)03-0065-04

0 概述

教育培训一直以来都是我国的重点发展行业之一,但传统的教育培训方式模式单一、生源不稳定、受到机构信誉及能力等影响,教学资源不互通也是其一大“痛点”[1-2]。基础教育阶段(简称 K12) 是创造力和创新思维培养的关键阶段,也是大部分教育培训行业所注重发展的方向[3]。随着“大数据”时代的到来和“互联网+”技术的快速发展,为了适应培训市场新需求、提高行业竞争力,将大数据技术与教育培训融合,更全面、更丰富的线上K12 教育培训模式应运而生[4-5]。

随着信息技术的不断更新和升级,微信小程序相结合受到越来越多用户的青睐。它是一种新的开放能力[6]。对用户来说,微信小程序无需下载是其最大的特点和优势,同时具有操作简便、所需数据流量少、使用门槛低等特点;对开发者来说,则有开发成本小、推广成本低等特性[7-8]。总的来说,“触手可及”“唾手可得”是小程序尤为重要的两方面优势[9]。这样的优势使得微信小程序逐渐深入各个领域且结合“互联网+”在社会各领域也得到了广泛的应用。在应用市场趋于饱和的背景下,搭建微信小程序平台实现教育培训服务具有很好的应用前景[10]。基于微信小程序的K12教育培训服务不仅具有传统教育软件打破时间和空间的双重限制、即时性高、传播范围广等优点,同时还具有微信小程序特有的轻量级、“即用即走”以及安全性高等优势[11-12]。同时结合大数据时代快速发展的数据收集及数据挖掘技术,以用户需求为先导,更高效的学习提升,实现用户多点定向的可持续发展[13]。

当下时代信息快速发展,微信小程序和教育培训服务相结合带来了便捷性等优势,但也出现了教育资源数据量急剧增加,价值密度随之大大降低的问题,因此帮助用户快速高效地辨别学习资源的价值并进行有效分类是一个重要功能[14]。文本分类指用计算机对文本(或其他实体)按照一定的分类体系或标准进行自动分类标记,同时所标注的数据具有一致性、高质量等特点[15]。因而本文将利用文本分类算法及学习模型实现学习资源的有效分类,试图通过利用数据科学与爬虫技术进行数据收集,利用大数据技术进行数据挖掘来解决这一问题,将冗杂的数据资源转化为价值更高的、可利用信息服务于我们的教育培训小程序。本文将搭建一个以用户需求为目标,实现资源有效管理且服务多样化的“专享智学”微信小程序教育培训平台,并试图解决传统教育培训模式的诸多问题。

1 系统设计

1.1 需求分析

本系统涉及家教老师、学员两类用户群体之间的交互,需要根据不同用户的需求设计相应的模块,同时为各主体分别赋予不同的适用权限、用户的应用模板和操作页面,并需要根据不同年级学生的需求设计相应的模块。

基于教育可持续理念的充分调研,参照学业等级评测所需的具体技能来综合考量主体需求。针对学员主要实现课程讲解、题库训练、查看学习数据等功能,针对教师主要实现资质核验、发布学习课程资源、直播讲解等功能。

1.2 功能模块

本系统整体结构包含后台数据库管理系统和前端客户端系统,其中前端客户端系统又分为学员客户端、家教老师客户端(如图1) 。

1) 首页模块

用户可实时观看直播内容并以此作为挑选心仪老师的依据之一,同时通过家教教师输出优质的视频内容,可以积累更多的用户和生源。如果用户想了解直播课程的全部或进阶内容,需要开通会员或者对单一课程进行付费,一定程度上增加了家教老师的收入来源。同时,针对用户的直播分享点击率对用户群体进行学科偏好和兴趣点等不同层次的分类,从而更好地为用户提供个性化的推荐。

2) 题库训练模块

用户可以查询不同学科,不同类型对应的考试资源及试题解析,通过“题库训练”功能,学员还可以及时查看测试情况及考试題型、试题信息。为调动学员自主学习积极性,还增设了每部分题目的作答情况排行榜,从而激励用户进行不断地提升。为使辅导更具针对性,设计时可考虑增设“模拟练习”板块,指导学员开展实战演练,以便对薄弱知识点、低分板块开展进一步个性化指导。

3) 学习模块

学习模块保存用户观看的学习视频、参与的课程活动以及学习的进度,用户再次登录时,不必查询历史记录来查找所观看课程视频,即可直接通过学习页面直接开始继续完成下一部分的学习,为用户提供了便利。同时,在课程学习模块添加“查看学习数据”功能,并结合大数据采集及分析技术,便捷及时地开展学员评价及课程推荐功能应用,从而阶段性生成个人学习电子报表及学习行为画像,为后续推荐相应学习策略、推送有效培训资源及服务讯息提供参考。

4) 课程模块

课程模块根据不同的用户群体赋予不同的适应权限,共计分为6个一级分组,包括初中的3个年级与高中的3个年级。每个一级分组下有包括语文、数学等9个科目选项。学员可以通过分类查询查看对应的试听课课程。同时每个课程内添加“教师简介”功能,可为用户在选择时提供一定帮助。

5) 个人中心模块

对于学员群体,小程序设置了“积分商城”功能,学员每完成一项任务就可以领取积分,积分可以在积分商城中折现或者兑换心仪物品,以通过采用激励机制来增加用户黏性,同时添加“投诉处理和意见反馈”的功能。针对小程序使用过程中出现的意外情况,如家教老师态度敷衍、教学质量差等问题,小程序设置统一投诉按钮,点击即可留言或致电人工客服进行投诉,届时将会有相关管理人员进行及时回复。该小程序的投诉处理和意见反馈功能的设计致力于将管理人员的管理和家教老师的工作透明公开化,在保证广大师生的利益的同时改善现阶段小程序管理的一些不足。对于家教老师群体设置了“资质核验”功能,以确保信息的真实性。

1.3 系统核心技术

1) 小程序开发框架

微信小程序采用由WXML、WXSS、JS和JSON等文件构成的Mina开发框架,开发前端通过主要包括对小程序的页面布局进行开发,设计出首页、题库页面等小程序页面,以及利用JS文件对小程序各页面之间的切换等功能进行设计。小程序开发后端通过API 接口实现对数据库中的题目数据、教师信息等数据的操作(如图2) 。

2) UI界面设计

小程序主体选用数位薰衣草紫渲染,由于淡雅的颜色会给人带来放松平静感,在当今快速发展的时代背景下,人们更加关注心理健康和幸福指数,因此Pantone的2023年度代表色被定为数位薰衣草紫[16],其波长较短,能够带给人更多稳定、平衡的感觉(如图3) 。题目资料来源于百度文库、知网等,力求做到严谨、详尽、清晰。题目信息以分学科、分主题的方式划分,同时以文字和图片相结合的方式呈现,同时会总结用户答题情况与答题积分排名,让用户可以在使用小程序增进知识的过程中,充满兴趣地学习知识,不断提升。

3) 文本分类

文本是信息传递的载体,NLP(Natural LanguageProcessing) ,也即自然语言处理技术,是研究如何让计算机读懂人类语言,即将人的自然语言转换为计算机可以阅读的指令。随着信息数据的大幅增长,人工标记数据表现出的耗费时间长、质量低、受标注主体的主观意识影响大等问题使人工标记数据不再可行。因此,利用机器实现自动化对文本数据进行标注、实现文本的分类在“大数据”时代下备受关注,并且机器学习将文本分类变得更加高效,其标注的数据具有一致性、高质量等特点。

本文在使用Python语言对题目数据进行文本分类时,利用爬虫爬取网络上大量的题目数据,采用Tgrocery及Pandas宏包处理结构化数据(如图4) 。

2 功能实现

2.1 题库功能实现

利用Python 爬虫获取大量题目数据信息,使用Tgrocery宏包中含有的Tgrocety函数对爬取到的题目数据进行训练得到文本分类模型,并利用此文本分类模型进行题目数据类别的预测(如图5) ,最终得到对题目类型分类的准确率达到93%以上的题目分类模型并将分类好的数据导入数据库并实现分类调取的目的。

将分类完成的题目数据全部导入数据库之后,通过SQL查询语句实现用户查询不同学科、不同类型对应的相关考试资源以及试题解析的功能。同时,本文通过在相应数据库下建立用户表和积分表对用户信息以及实时更新的总积分进行存储以实现学习积分的排行榜实时更新功能(如图6) 。

2.2 视频直播功能实现

本文通过WebRTC 实现媒体流的获取、建立连接、数据传输、编解码以及数据展示,使小程序支持视频直播功能,还可以将视频数据压缩成较小的文件,以便将视频数据推送至服务器(如图6) 。同时,利用ICE框架进行网络探测和NAT穿透,保证学员和家教老师的相互通信。

2.3 学习模块实现

利用UI设计技术设计学习页面,分为“我参与的”“学习进度”和“学习报表”三个小程序界面板块。其中“我参与的”展示用户已参与的课程和活动,“学习进度”页面展示用户参与课程和考试的进度,“学习报表”页面则结合大数据采集及分析技术,便捷及时地开展学员评价及课程推荐功能应用,从而阶段性生成个人学习电子报表及学习行为画像,为方便用户需求,设计并实现了客服反馈功能(如图7) 。

2.4 课程模块实现

利用Java中的jar库实现小程序页面的分类查询功能。对于前端,用户输入查詢内容后点击“查询”按钮就会向服务器发送请求查询数据库中的数据并响应到前端页面。对于后端,通过使用limit关键字限制查询的位置和数量从而实现数据库的查询并将查询的数据响应给前端实现分页。并利用UI技术以及简单的数据库技术将表分为不同的年级和科目,实现结果如图7所示。

2.5 分类查询功能实现

利用Java中的jar库实现小程序页面的分类查询功能。对于前端,用户输入查询内容后点击“查询”按钮就会向服务器发送请求以查询数据库中的数据,然后响应到前端页面。对于后端,通过使用limit关键字限制查询的位置和数量从而实现数据库的查询并将查询的数据响应给前端实现分页功能。

2.6 个人中心模块

为了方便客户的使用与沟通,本文在个人中心模块中实现了客服反馈功能,客户反馈的信息与意见将实时传送至后台,使后台客服可以及时查看到客户发送的信息,同时个人中心模块中还实现了查看所购买的课程、已完成的课程、用户收藏的课程以及用户正在学习的课程。

3 结束语

随着时代的发展,开展在线培训教育已然是大势所趋,本文所搭建的专享智学微信小程序,使用准确率达到93%以上NLP文本分类模型解决题目信息复杂难以分类的问题,为用户提供了更专业题目,并使用数据库技术将其录入题库,实现学习资源的有效分类。同时还实现了直播授课、在线答题、错题收录、线上家教等人性化、多样化功能,满足“多点定向”的教育培训可持续发展。在接下来的研究过程中,本文小程序将继续完善NLP文本分类模型以实现更长更复杂的题目分类和增加其他功能模块提升系统功能,根据用户体验进行优化迭代。

【通联编辑:王力】

猜你喜欢
文本分类微信小程序大数据
信息技术与专业课程融合路径探索
当图书馆遇上微信小程序
基于组合分类算法的源代码注释质量评估方法
基于贝叶斯分类器的中文文本分类
基于蚁群智能算法的研究文本分类
文本分类算法在山东女子学院档案管理的应用
基于大数据背景下的智慧城市建设研究