一种基于AI配音技术的微课简便制作方法

2023-01-28 17:32福建船政交通职业学院经济与管理学院朱娜娜
内江科技 2022年4期
关键词:录屏脚本音频

◇福建船政交通职业学院经济与管理学院 朱娜娜

微课制作是一个比较繁琐的过程,利用AI配音技术,采用先制作音频,后制作视频,然后进行剪辑合成的创新方法,可是实现操作简单快捷、提高配音质量的效果。

我国教育部于2018年印发了《教育信息化2.0行动计划》,其中重点强调了发展智能教育、办好网络教育,以人工智能、大数据、物联网等新兴技术为基础,依托各类智能设备及网络,积极开展智慧教育创新研究和示范,推动新技术支持下教育的模式变革和生态重构[1]。2008年美国一位名为戴维.彭罗斯的学院高级教学设计师首创“微课程”概念,而在我国“微课”是佛山市教育局的胡铁生最早在2011年提出来的,他认为,“微课”是以教学视频为主要载体,教师针对某个知识点或教学环节而进行教学活动的各种教学资源有机组合[2]。近年来,在我国互联网+、教育信息化浪潮的推动下,全国的各大高校、中小学校的微课制作如火如荼展开。如何高效、简易可行地制作微课,成为每个制作微课教师面临的普遍问题。当今人工智能与信息技术迅猛发展,AI配音应运而生并且技术不断取得突破。AI配音,也称为“人工智能配音”、“合成语音”,在社会各行业得到越来越广泛的应用[3]。在教学视频、音频制作中,科学合理应用AI配音,不仅能达到播报准确、语音标准、语速适当、节奏有序和流利的效果,而且配音环节也非常方便易操作,视频和音频的后期剪辑也能有效地降低难度和工作量。如此,可以很大程度上解决教师制作微课的部分痛点,方便更多的普通教师参与到教学视频的制作中来,实现教学视频和音频的数量和质量快速提升。

1 微课制作的主要痛点之一

胡铁生在对我国527位高校微课参赛教师的调查问卷中发现,有超过50%的教师认为微课视频的后期编辑加工技术难度大,技术问题成为多数教师在制作微课过程中遇到的最大困难[4]。微课有多种类型,通常制作的基本流程是:①设计与素材准备:确定课程整体结构大纲、各个细分微课选题,准备具体内容和相关素材;②制作视频:配合前期准备的图文内容或实景、操作过程等,教师讲授、演示,同时进行拍摄、录音、录屏等操作;③后期剪辑与优化:删除和替换错误、多余的内容,插入辅助素材和添加各种效果、调整美化等。在该制作流程中,大部分普通教师都会面临的共同痛点之一,就是在录制或拍摄微课过程中,虽然已经准备有脚本,而且配合提词器看到滚动的脚本内容,但还是会出现错讲、漏讲、多讲,停顿节奏不合理,普通话不标准,音色不美,发音不够清晰,由于紧张和不够熟练等因素导致讲解的表情和语气机械僵化等各种情况,如此导致了在录制过程中需要多次重新开始,在后期剪辑中需要很细致地去捕捉诸多大大小小的错误,进行修剪和拼接、调整,非常费时费力,而且普通话不标准、音色不优美,发音不够清晰等问题,是后期剪辑基本上无法改变的。

2 AI配音的可行性

2.1 AI配音的技术条件

早在2018年1月,中央电视台播出大型纪录片《创新中国》,就是全球第一个利用人工智能配音技术重现已故的著名配音大师李易老师的声音。2018年11月,世界第一个AI合成主播在新华社“上岗”。近几年来在商业应用的推动下,特别是随着自媒体行业的发展,目前AI配音通过文本结构与语种判断、文本标准化、文本转音素、句读韵律预测等技术方面的不断改进,已成为较成熟可落地的产品,在各种场景的应用越来越普遍。AI配音的音质优美和丰富多样,能够模拟真人的韵律进行合理停顿、重读、轻读、情感的语气表现,实现声音的高低曲折、抑扬顿挫、字间协同过渡平滑、自然等效果,已经有很多品牌能做到。

2.2 AI配音的主要优点

首先,AI配音工具的选择性广泛、简单易得。各种品牌的AI配音平台和软件非常多,有电脑端的网络在线、软件,也有手机端的微信小程序、APP。电脑端的主要有讯飞配音、百度智能云在线语音合成、腾讯云语音识别、小马配音、知意配音、迅捷文字转语音软件、风云文字语音转换器等;手机端的主要有讯飞听见、配音家、配音神器专业版、标贝悦读、录音转文字助手等。基本的操作模式就是录入或粘贴文字内容在对应的窗口,选择语音风格(男声还是女声,稳重低沉还是温柔甜美、诙谐幽默还是成熟知性等),设置停顿、多音字、局部变调、局部变速度等,然后就稍等几秒钟,就能自动生成一个清晰流畅、无噪音的音频文件。操作非常便捷快速,远比人工朗读节省时间。

再者,AI配音成本低。很多AI配音是免费试用的,即使是付费,也算经济实惠,能起到花小钱解决大问题的效果。付费能得到更全面的服务,例如,微信小程序“配音家”的普通会员17.99元/月,“讯飞配音”的会员费是45元/月,长期会员月均费用更低,可满足期限内无限次配音以及各种精细化的设置。

另外,AI配音制成的微课小音频方便后期剪辑处理。微课的一个关键特点是“短小精悍”,一个微课的持续时间通常是5~10分钟,一般少于20分钟。一个微课文稿(脚本)内容大概在1500~2000字,在正常语速情况下,录制的音频大约6~10分钟,不仅在脚本撰写和修改方面很方便,在后期剪辑方面,因为一个比较小的音频文件,放在剪辑软件的音轨上,很方便进行放大、剪切、调整位置、对应添加与修改字幕等精细操作。

3 基于AI配音技术的微课制作实践

3.1 准备工作

首先,在定好系列微课细分主题的基础上,围绕具体的每一个微课进行PPT制作和脚本撰写。PPT要应用简要的文字突出重点,并配以相应的图、表、小动画、视频等(这些素材也可以等到后期应用剪辑软件再插入),力求清晰、简明扼要、逻辑结构条理。而脚本其实就是教师的演讲稿,要根据PPT来详细化,加入必要的、适当的过渡性语句,并按顺序和页面内容对PPT里的主题或者关键词展开详细解析和补充扩展。为了接下来在对脚本文字进行AI配音中,能有对应合理的停顿,以及在后期录屏制作中能更好地与PPT翻页同步配合,在脚本撰写时需要注意分隔,特别是对应每一页PPT的内容进行分段,必要的时候也可以做好标记,在录屏时可查看与对照操作,减免操作失误。

3.2 应用AI配音技术制作音频

利用电脑端(在线平台或软件)或者手机端(小程序或APP),对完善的脚本利用AI配音进行音频制作。以手机端微信小程序“配音家”为例,为了方便操作(特别是实现脚本内容的直接复制粘贴和后期音频直接下载到电脑剪辑),可以在电脑端打开微信软件,进入小程序里的“配音家”,在其配音主页面粘贴上前面已经准备好的脚本内容,然后,选择合适的音色优美的“朗读员”,并在需要地方插入停顿(可根据情况,插入1秒、1.5秒、2秒……5秒的停顿时间),如果有多音字,可以进行多音字纠正设置,还可以调整音量、语速。以上各种设置完毕后,直接点击“生成语音”,稍微等待不到1分钟,一个10分钟左右的音频就生成了,可以在线进行预览试听,如果发现有差错和不满意的地方,可以重新编辑,重新修改、设置和生成音频,直到没问题,就点击“下载音频”,把MP3格式的音频下载到电脑里待后期使用。除了以上设置和操作,还可以根据需要添加背景音乐、音频格式转换、拼接成对话等操作。类似的配音软件和在线平台,基本操作方法大同小异。国内行业领先的专业配音网“讯飞配音”还能进行“局部变调”、“局部变速”的设置,以便更接近真人播音的音调变化。整个AI配音过程基本上非常简单易上手、快速方便,在脚本准备完善的基础上,10分钟之内就可以做出一个音频,尤其是操作熟练后,制作过程可实现一次性顺畅完成。

3.3 根据音频制作视频

根据前面准备好的PPT,教师要听着上一步制作好的讲解音频(电脑端如果采用全屏录屏,音频在电脑里就不方便同时操作,可以把音频转发到自己的微信,用手机做辅助,进行播放),采用电脑录屏软件进行PPT操作录屏。也就是,对PPT的操作动作和进度要根据已录制好的音频进行。最基本的操作是翻页,如果PPT有另外设置动画效果,要细致准确地捕捉讲解音频的进度,以便让动画动作和翻页都能与音频内容同步对应。教师最好能事先熟悉讲解音频里关键内容与PPT内容的对应关系,或者同时查看前面做好标记的脚本,一般就不会出差错和慌乱。这一步的关键是根据音频来自制作视频,改变了以往视频音频同步录制的常规做法。以往常规做法是播放PPT录屏,教师要边看PPT内容,边操作PPT(翻页、标注、点击动画动作等),还要对照脚本来讲解或者临场发挥讲解,容易手忙脚乱、顾此失彼,导致不断重复和各种差错,而且后期精细剪辑的工作量比较大。

3.4 视频与音频的剪辑合成

得益于近年来自媒体行业的快速发展,目前的剪辑软件非常多种,适合普通教师的容易上手、便捷好用的主要有:剪映、Camtasia、蜜蜂剪辑、快剪辑等。基本操作也类似,就是把音频和视频都导入到剪辑软件,把视频本身的声音关闭或调整为静音,而采用之前制作好的音频。根据上一步的操作,此时的音频与视频一般都可以做到同步对应的,即便有些地方不同步,也可以把音频或视频进行剪切,然后针对某一段在音轨或视频轨上进行移动,直到音频内容与视频内容同步对应。在此基础上,对合成的视频进行进一步优化,可以插入相应的辅助视频、动画和图片,添加字幕、音效、背景音乐、画面特效、特殊片头片尾等效果,进行色彩、亮度、清晰度等调整美化。最后,以高清格式(一般是1080P)导出成品微课。在这一步,就省去了对真人讲解时错讲、多讲、漏讲的精细识别和剪辑,也不需要降噪处理,如果采用音频自动转字幕的功能(像“剪映”软件就可以实现),还会因为AI配音的普通话比真人播报更标准从而使得字幕识别率更高,可以节省大量的修改和调整时间。

4 结束语

微课作为教育信息资源的其中一种类型,它的制作也要遵循“适用、实用、易用”的基本原则,才有进行推广应用和被普遍接受的基础。利用AI配音,结合PPT录屏的简单快捷微课制作方法,能够降低普通教师们亲自全程制作微课的难度。虽然真人配音具有传递微妙感情、更加灵活生动等优点,但是在客观上,广大的普通授课教师没办法全部达到专业播音主持人的程度和水平,在播音连贯准确、流利清晰、发音标准、音色优美等方面是远远不及AI配音的。随着人工智能技术的持续发展,AI配音技术也持续优化和迭代,必将向更加人性化、更加贴近真人讲解的方向发展。利用AI配音制作微课,因其便捷性和良好效果值得教育界推广应用以及更深入的研究与实践。

猜你喜欢
录屏脚本音频
酒驾
安奇奇与小cool 龙(第二回)
视频、音频剪辑类APP
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
快乐假期
音频分析仪中低失真音频信号的发生方法
小编的新年愿望
《数据库高级应用》教学创新方法研究
Camtasia studio 在教学视频制作中的应用研究