项目驱动教学法在语音信号处理课程中的探索与应用

2022-06-21 01:14赵小燕,梁瑞宇,童莹,包永强,王青云
计算机时代 2022年6期
关键词:教学实施

赵小燕,梁瑞宇,童莹,包永强,王青云

摘  要: 语音信号处理技术具有很强的专业性、先进性和实用性。将项目驱动教学法应用于语音信号处理课程教学,从项目设置、项目执行和项目评价等方面探索其实施路径,并以声源定位为例,阐述教学实施过程。教学实践表明,该模式有效激发了学生的学习积极性和主动性,提升了学生综合应用知识的能力,为学生今后开展科研和开发工作打下了良好基础。

关键词: 语音信号处理; 项目驱动教学; 声源定位; 教学实施

中图分类号:G642          文献标识码:A     文章编号:1006-8228(2022)06-112-04

Exploration and application of project-driven teaching method

in the speech signal processing course

Zhao Xiaoyan, Liang Ruiyu, Tong Ying, Bao Yongqiang, Wang Qingyun

(School of Information and Communication Engineering, Nanjing Institute of Technology, Nanjing, Jiangsu 21167, China)

Abstract: The speech signal processing course is highly specialized, advanced and practical. The project-driven teaching method is applied to the teaching of this course, and its implementation path is explored in terms of project setting, project implementation and project evaluation. Taking sound source localization as an example, the teaching implementation process is described. The results of practical teaching show that the mode has effectively simulated students' learning enthusiasm and initiative, improved their ability to comprehensively apply knowledge, and laid a good foundation for students to carry out scientific research and development work in the future.

Key words: speech signal processing; project-driven teaching; sound source localization; teaching implementation

0 引言

語音信号处理技术是人类社会走向智能化的关键技术之一。语音信号处理以语音语言学和数字信号处理为基础,与生理学、心理学、计算机科学、模式识别和人工智能等学科有着密切联系[1,2]。语音信号处理是信息工程专业重要的专业课,具备专业性、先进性和实用性。传统单一的教学模式(板书、多媒体课件展示等)难以实现对学生自学能力、理论联系实际的能力、实践能力和科研能力的培养,加之课程的理论复杂、内容更新快、学习难度大,很多学生的学习积极性和主动性不高,甚至产生了畏难和厌学情绪,教学效果不佳。本文探索在语音信号处理课程教学中采用项目驱动教学法,将教学内容融入实际工程项目,让学生主动参与教学活动、自主完成项目。本文以声源定位为例,阐述具体教学实施过程。实践表明,该教学方法显著提高了教学效果。

1 项目驱动教学法在语音信号处理过程中的实施过程

语音信号处理课程的教学内容包括语音信号处理基础知识、分析方法及技术与应用三部分。语音信号处理基础知识包括语音信号的产生、特性、数学模型等;分析方法包括预处理、倒谱分析、线性预测分析、特征参数估计等;技术与应用包括语音增强、语音识别、声源定位等[3,4]。前两部分内容是本课程的基础理论,采用传统教学模式。第三部分内容采用项目驱动教学模式,教师设计与教学内容相关的实际项目,引导学生在完成项目的同时逐步完成课程内容的学习[5]。项目驱动教学法以教师作为教学主导,以学生作为教学主体[6]。教师设计项目选题,细化任务点,指导和帮助学生执行项目任务;学生自主学习,协作分工,完成项目任务。教学实施过程包括项目设置、项目执行和项目评价三个步骤。

1.1 项目设置

教师设置与课程相关的项目选题,将知识点融入项目的不同环节。规划项目时应充分考虑项目的专业性、可实施性、知识点覆盖以及与实际应用的衔接。结合教学大纲要求,共设置了八个选题,分别是语音增强、语音合成、语音识别、说话人识别、情感识别、声源定位、语音编码和语音隐藏,涵盖了本课程第三部分教学内容。以声源定位为例,教师将项目细分为四个环节:房间声学环境分析、基于时延差的声源定位、基于可控波束形成的声源定位和拓展任务,各环节循序渐进、环环相扣,每一个环节包含若干任务点,内容涵盖了声源定位主要知识点和应用场景,兼顾理论性和实用性。学生组成3-4人的项目小组,自由选择课题。

1.2 项目执行

在项目执行阶段,学生带着任务,先查阅资料、学习理论知识;然后分析项目内容、分配任务、制定方案、完成项目;最后提交项目作品、撰写项目报告,并进行汇报答辩。在此过程中,教师需及时关注项目进展,参与讨论,帮助学生梳理理论知识,指导学生分析项目内容,引导学生将理论知识应用于项目设计开发,同时提供一些必备的资料,如数据库、函数库、参考文献等。以声源定位为例,学生查阅文献资料,自学声源定位的理论知识。然后,教师指导学生运用理论知识分析该项目的四个环节任务,包括房间声学建模理论、时延差估计算法、波束形成理论等,逐步引导学生完善解决方案。最终,学生自主完成项目内容,具体包括:方案设计、程序编写、调试仿真、结果分析、成果演示、汇报答辩等。

1.3 项目评价

根据项目的完成情况进行评价,总结教学效果。项目评价包括:执行情况(50%)、汇报答辩(30%)、项目报告(20%)。执行情况主要考查方案制定情况、自主学习能力、知识综合应用能力、实践动手能力、项目完成质量。汇报答辩主要考察学生的理论知识掌握程度和语言表达能力。答辩时要求学生汇报整个项目流程,演示项目成果,讲解其涉及的理论知识。执行情况和汇报答辩均采用教师评价、组间互评、组内互评相结合的方式。项目报告主要考察报告的完整性、规范性、准确性和创新性,报告内容包括课题背景、方案流程、算法原理、实现过程、结果分析、归纳总结、参考文献等。

2 “声源定位”教学设计

以声源定位为例,说明项目驱动教学法在语音信号处理课程中的应用实践。

2.1 房间声学环境分析

建立灵活、合理的房间声学模型对声源定位算法的运行、评估具有重要的作用[2]。镜像(Image)法是构建室内声学环境模型最常用的方法之一,该方法通过建立房间脉冲响应模仿室内声学环境。教师帮助学生梳理房间声学理论知识,学生用MATLAB语言实现Image算法,完成以下任务:

⑴ 总结影响房间脉冲响应的因素;

⑵ 从房间脉冲响应中获取直达声传播时间;

⑶ 已知房间环境和声源原始信号,模拟传声器接收信号。

图1是不同混响时间的房间脉冲响应。由图1可见,混响时间为0s时,声学环境模型为理想自由声场,声波经过一段传播时间后直达接收点,传声器接收信号中只有直达声。随着混响时间增大,声波在室内各方向来回反射又逐渐衰减,接收信号包含直达声和混响声。后续“时延差估计算法”中所指的“时延”即指直达声的传播时间τ,其理论值为τ=d/c,其中d表示声源到接收点的距离,c表示声波传播速度。

图2是声源原始语音信号和传声器接收信号,混响时间为0.3s,信噪比为20dB。具体实施过程为:将声源信号与房间脉冲响应卷积,然后根据信噪比加上噪声。学生可以通过音频播放,对比原始信号和接收信号的差异,直观感受混响时间对接收信号的影响。

该环节难度不高,学生可独立完成。通过上述任务,可以完成以下知识点的教学:

⑴ 直达声、混响声、混响时间的概念,影响房间脉冲响应的因素;

⑵ 房间声学环境的建模方法;

⑶ 已知房间环境和声源原始信号,模拟传声器接收信号。

2.2 基于时延差的声源定位

在获得传声器接收信号的基础上,引入下一个教学内容,即如何利用接收信号实现声源定位。定位方法主要有高分辨率谱估计法、可控波束形成法和基于时延差的方法。基于时延差的定位方法计算量小、易于实现、应用广泛,因此项目从该方法入手,任务要求如下:①利用传声器阵列的接收信号,估计阵元间的时延差;②根据时延差和阵列几何位置进行声源定位。

基于时延差定位的第一步是进行时延差估计,其精度决定了定位系统的精度。广义互相关法是一种经典的时延差估计算法,该算法求两信号之间的互功率谱,并在频域内给予一定的加权,以抑制噪声和混響的影响,再反变换到时域,得到两信号之间的互相关函数,通过检测互相关函数的峰值估计时延差[2]。图3为不同加权的广义互相关函数。学生调整混响和噪声环境,测试和分析各加权函数对噪声和混响的抑制能力。基于时延差定位的第二步是根据测定的时延差和阵列几何位置计算声源位置,定位方法有球形插值法、线性相交法、最小二乘拟合法等。学生根据实际情况选择算法,完成声源定位任务。

该环节有一定难度,教师需要帮助学生梳理时延估计方法、最小二乘拟合等理论知识,指导学生进行算法特性分析,引导学生思考如何根据实际应用场景选择合适的方法。通过上述任务,可以完成以下知识点的教学:

⑴ 广义互相关法的概念、步骤;

⑵ 各种加权函数的特性;

⑶ 根据时延差确定声源位置的方法。

2.3 基于可控波束形成的声源定位

基于时延差的定位算法对噪声和混响的鲁棒性不强。为提高定位性能,引入下一个教学内容,即采用可控波束形成法实现声源定位,任务要求如下:

⑴ 实现可控波束形成声源定位算法;

⑵ 测试不同声学环境中可控波束形成法的定位精度和鲁棒性;

⑶ 对比可控波束形成法和基于时延差定位方法的性能。

波束形成法用声波的达到时延差控制波束方向,使输出功率最大的波束方位即为声源的方位。学生自学波束形成理论知识,用MATLAB语言实现相位变换加权的可控波束形成法。图4为不同噪声环境下,均匀圆阵的波束形成输出功率。由图可见,噪声使空间功率谱呈现较多的局部峰值,对定位结果造成影响。

该环节有一定难度,教师需要帮助学生梳理波束形成理论知识,指导学生比较和评价不同算法,总结各算法的优缺点和适用情境。通过上述任务,可以完成以下知识点的教学:

⑴ 波束形成的概念和计算流程;

⑵ 波束形成的输出功率与广义互相关之间的关系;

⑶ 算法运行的评价方法。

2.4 拓展任务

针对复杂声学环境下的声源定位,引导学生研究以下问题:

⑴ 将传统定位算法与机器学习相结合,实现基于分类机制的定位;

⑵ 引入子带的方式实现多声源定位。

以上扩展任务可拓宽学生思路,培养学生创新思维和科研能力。

3 结束语

将项目驱动教学法应用于语音信号处理课程的教学,以教师作为教学主导,把教学内容融入实际工程项目,让学生自主完成项目,从而实现主动学习。教学实践表明,该教学模式取得了很好的教学效果。首先,学生学习的积极性和主动性被激发,师生间的教学互动得到加强;第二,学生实现了基础理论知识与实际应用的衔接,自学能力、实践能力、科研能力、综合知识应用能力都得到提升;第三,学生之间的团队协作精神得到加强;最后,学生的语言表达能力得到锻炼。此教学模式在信息工程专业其他课程教学中具有一定的推广和借鉴意义。当然,该教学模式还需要不断完善,如何更好地融入工程教育理念,如何更科学精确地对学生进行考核和评价,如何将人工智能技术引入到课程教学,这些都需要进一步改进和探索。

参考文献(References):

[1] 胡航.现代语音信号处理[M].电子工业出版社,2014

[2] 梁瑞宇,赵力,王青云.语音信号处理(C++版)[M]. 机械工业,2018

[3] 梁瑞宇,包永强,唐闺臣,等.语音信号处理实践课程的教学研究与改革[J].高教特刊,2019(13):73-75

[4] 王青云,梁瑞宇,赵力,冯月芹,包永强.实时语音信号处理教学与实验方法研究[J]. 实验室研究与探索,2019,38(9):186-189

[5] 兰义华,齐庆磊,张振莲.项目驱动的学习共同体教学模式在数据库课程教学中的探索与实践[J]. 计算机时代,2020(10):95-98

[6] 郝中骐,刘莉,史久林,万生鹏.“双创”背景下光电类课程微项目驱动教学研究[J].教育教学论坛,2021(17):148-151

猜你喜欢
教学实施
浅析初中数学高效课堂的教学方法的实施
“翻转课堂”在高校会计电算化课程教学中的有效实施
游戏化教学在幼儿园课程教学中的实施
模具设计与制造专业基于能力递进的中高职课程衔接方案
校本特色课程的教学实施与评价
小组合作探究模式在初中英语课堂教学中的实施
任务驱动教学法在成人教育中的运用分析
一场及时的春雨
浅谈数控一体化教学
浅析小学语文“经典诵读”的实施