基于TRTC 的广播节目互联网语音互动系统

2022-04-28 00:22
电声技术 2022年3期
关键词:控系统连线音频

赵 勇

(宁波广播电视集团,浙江 宁波 315000)

0 引言

广播节目以其互动性强、参与度高的特点深受人们的喜爱。然而,听众参与节目的主要手段依旧是较为传统的热线电话。随着4G、5G 移动通信技术的不断普及,数据通信网络的带宽大幅提高,通过移动互联网传输高码率音频信号变得比以前更加容易。同时,手机流量的费用也随着新技术的普及而日益下降。基于移动互联网的语音通信技术随之广泛普及。人们更多地使用微信语音通话进行沟通,使用传统电话的人越来越少。传统的热线电话作为广播电台与听众互动的主要手段,也显得有点陈旧和落后。加上其先天性的技术局限性,导致其语音质量及信息化程度都不够理想。因此,广播节目需要通过互联网建立全新的语音互动系统,以适应新的技术环境和听众习惯。

1 广播节目互联网语音互动系统的三大核心诉求

1.1 选择平台无缝衔接听众的互联网语音互动习惯

随着移动互联网技术的不断发展,微信这个具有鲜明移动互联网时代特征的通信软件,几乎在每个国人的智能手机中占有一席之地,逐渐代替了电话和短信成为人们主要的通信工具[1]。微信小程序的推出,使微信从最初的即时通信工具成长为一个巨大的信息及社交平台。为了契合人们当前的互联网语音互动使用习惯,同时借助微信平台强大的技术能力和平台效应,为广播听众提供更加优质便捷的使用体验以及获得更加广泛的传播效果,使用微信小程序作为语音互动系统听众端的交互入口,是一个非常理想的选择。

1.2 实现互联网与传统广播播控系统间的音频传输与控制

传统广播电台的热线电话系统依然使用模拟的电话信道,因其技术上的局限性,只能够传输频率在300~3 400 Hz 的音频信号,导致音频信号的清晰度有所欠缺,并且存在挂断音、电磁干扰、雷击等问题[2]。同时,其无法在移动互联化方面进行有效的扩展,不能与微信小程序等互联网应用兼容。因此,需要一种能够传输20 Hz~20 kHz 全频带立体声的,并且能够兼容微信小程序等互联网应用的通信信道。腾讯实时音视频(Tencent Real-Time Communication,TRTC)服务可以很好地解决以上问题,成为用户端与电台端进行语音交互的主要信道,可以利用基于IP 化音频(Audio over IP,AOIP)技术的专用设备将特定语音信号转换成AES/EBU 数字语音信号传入传统电台直播调音台,从而在提升通话质量、确保信号安全的前提下,实现互联网与传统广播播控系统间音频信号的传输与控制。

1.3 确保音频管控流程符合广播节目导播流程

在有听众连线的广播直播节目中,为了保证节目质量和播出安全,导播和主持人需要对直播连线的各个环节进行全程管控。互动连线开始,导播通过提前交流,对连线听众的身份、意图、诉求等关键信息进行甄别[3],连线控制主要实现主持人和导播对互动连线的接通、转接、挂断等操作,这些都是广播节目区别于单纯互联网语音沟通的特殊系统需求。因此,为了方便主持人和导播能够独立、安全、便捷地掌控整个连线过程,广播节目互联网语音互动系统的设计需要定制开发一套符合流程需求、操作直观便捷、功能完整匹配的软件系统和小程序平台。

2 广播节目互联网语音互动系统的实现与关键技术

2.1 互动系统概述

互联网语音互动系统主要由微信小程序、云服务器、TRTC 服务、导控系统以及AOIP 网络音频路由系统等模块组成,系统框架如图1 所示。

图1 系统框架图

微信小程序是整个系统的互动入口,用户可以使用手机、电脑、Pad 等终端通过小程序与电台主播进行高品质的实时语音互动,可以在小程序内进行语音和文字留言,可以将实时语音连线转发到微信群进行高效传播。

云服务器用来存放微信小程序的代码、存储转发后台数据以及运行各种后台服务。云服务器架设在腾讯云上,使用云服务器代替本地服务器,可以有效地降低整个系统的前期建设成本,同时后期升级扩容也十分便利,具有可按需付费的优势。同时,云服务器采用分布式架构,具有更强的抗灾容错能力,并且采用多线互通的互联网入口,具有更快的访问速度,十分适合小程序的部署[4]。

TRTC 服务是整个系统的核心语音信号传输信道。它是腾讯公司开发的一种实时语音传输云服务,具有跨平台传输高保真实时语音信号的能力。因此,可以通过TRTC 服务实现用户端小程序与电台端导控系统两种不同设备平台之间语音信号的高质量、低延时的实时传输。

导控系统是为主持人和导播提供连线过程管理的PC 端图形化操作软件,为主持人和导播提供连线控制、信息呈现、图文沟通、系统设置以及后台管理等主要功能,并承担着电台端语音信号接收与转发功能,确保连线时的节目质量和播出安全。

AOIP 网络音频路由系统是电台本地端的音频信号传输控制系统,其主要功能是对适用于微信小程序的互联网语音信号和适用于直播调音台的数字音频信号进行输入输出的控制和音频格式的相互转换,同时避免互联网设备直接接入调音台,起到保障实时连线节目安全播出的隔离作用。

2.2 TRTC 技术打通用户微信端与电台广播节目的隔阂

腾讯实时音视频(Tencent Real-Time Communication,TRTC)是由腾讯公司开发的音视频交互解决方案。它以多人音视频通话和低延时互动直播为两大主要应用场景,具有可快速搭建、跨平台部署、低成本、低延时、高品质以及全球覆盖等优点,通过腾讯云服务向开发者开放。由于其为腾讯公司旗下产品,因此对微信生态具有非常好的兼容能力。

开发者可以在自己的程序和应用中集成TRTC 的软件开发工具包(Software Development Kit,SDK),通过SDK 提供的应用程序编程接口(Application Programming Interface,API)与实时音视频TRTC 云服务后台连通,由TRTC 云服务通过私有的用户数据报协议(User Datagram Protocol,UDP)对双方的音视频数据进行处理和传输。本系统主要应用了TRTC 的多人语音通话模式,简单来说,就是通过调用SDK 使用云服务进行推拉流的过程。主要工作流程如图2 所示。

图2 TRTC SDK 工作流程图

(1)加入房间。房间这一虚拟概念,在TRTC中用于区隔不同的用户群组。参加音视频交互的用户加入同一个房间。同一房间内的用户可以进行实时音视频数据的传输。

(2)发布本地流。加入房间后,系统将本地音视频设备采集的音视频信号经过处理、编码、封装,将数据流上传至云服务器,再由云服务转发给同一房间内的其他用户。

(3)订阅远程流。当房间内有用户发布了本地流,其他用户就需要利用SDK 接收云服务器转发的来自远端其他用户发送的经过处理的音视频数据流,并通过显示设备进行展示和播放。

(4)取消发布本地流。如果在通信过程中需要重新发布其他的本地数据流,可以取消发布本地流,用于取消后达到切换效果,但是不会影响订阅流。

(5)退出房间。SDK 会自动取消订阅远程流和取消发布本地流,然后退出房间。

从加入房间到退出房间,可视为一个完整的TRTC 通话模式工作流程。每个客户端都需要一次完整的流程,才可视为一次完整的音视频通话过程。这种工作模式非常贴合电台语音互动的时效性和私密性,同时真正高效衔接了微信用户与传统电台节目。

2.3 AoIP 解决了互联网与传统广播播控系统间的音频传输与控制问题

IP 化音频(Audio over IP,AOIP)是指在普通局域网内以IP 方式传输不压缩音频信号的技术,具有高保真、低延时、大容量的特征。虚拟声卡是AoIP 的一个特色,普通工作站只需安装驱动就能升级成一个AoIP 设备,该工作站就能通过本机网卡接入AoIP 网络,直接录制或播出网络中的音频。

本系统使用的Dante 技术是AoIP 众多协议中的一种。Dante 是目前使用范围最广、拥有产品数量最多的AoIP 技术。由于使用了相同的接口板卡和控制软件,不同厂商的Dante 设备间互联方便,因此具有较好的兼容性。因其封闭协议不开放的特性,Dante 设备具备较高的安全性[5]。

AOIP 网络音频路由系统主要由DVS(Dante虚拟声音卡)、Dante Controller(音频路由控制软件)以及AOIPBox 网络音频路由器组成。将Dante 虚拟声音卡安装在PC 导控系统主持人端电脑上,通过在导控系统主界面的设置选项里选择DVS 通道,就可以将PC 端导控系统的音频输入输出通道设置为Dante 的虚拟声卡通道。这样,PC 端导控系统就能将适用于微信小程序的TRTC 协议信号和适用于电台端内部传输的Dante 协议的AOIP 信号进行转换,以便在不同的网络中传输。每台主持人端电脑都装有双网卡,一块网卡用于连接互联网,可与微信小程序端进行通信,另外一块网卡用于连接AOIP 音频网络,传输AOIP 音频信号。

网络音频路由器安装在总控机房,AOIPBox可以对Dante 协议的AOIP 信号和AES 数字信号进行相互转换。AOIPbox 通过AES 数字音频信号线路与总控音频矩阵连接,由总控音频矩通过串行多通道音频数字接口(serial Multi-channel Audio Digital Interface,MADI)光纤接入直播调音台。在总控机房部署一台控制电脑,该电脑上安装Dante Controller 路由控制软件,用于控制AOIP 网络内信号路由,可以使各个直播室内的导控系统的虚拟声卡输入输出通道与AOIPBox 的数字音频输入输出通道一一对应,最终使得各个直播室内的导控系统主持人端电脑与调音台的输入输出信号相对应,可以进行正常的信号传输。

在每个直播室和总控机房都有办公局域网接入交换机,通过在办公局域网内划分虚拟局域网(Virtual Local Area Network,VLAN),利用现有的网络设备搭建了一套AOIP 网络。直播室里的主持人端电脑和总控机房的AOIPBox 可以通过此网络进行互联网音频和电台数字音频信号的转换与传输。

2.4 PC 端导控系统确保互联网音频管控流程符合广播节目导播流程

PC 端导控系统安装在两台具有双网卡的导控电脑上。这两台导控电脑分别由主持人和导播控制。导控电脑的其中一块网卡连接互联网,与小程序服务器通信,使用TRTC 服务传输语音信号;另一块网卡连接AOIP 网络音频路由系统,进行台内的语音信号传输。PC 端导控系统软件采用微软公司发布的C#高级编程语言开发,实现了PC 端导控系统的各种功能,主要功能模块如下。

2.4.1 系统功能

PC 端导控主要有以下系统功能。

(1)频道及房间管理功能。使用该功能,可以设置频率名称及互动主题,设置完后会在小程序端显示,可以设置直播间、导播间的最大容纳人数。当直播间、导播间的人数超过最大容纳人数,新的连线会进入排队列表等待。

(2)用户管理功能。该功能可以显示用户的信息如手机号码、微信昵称等,同时也可以管理黑白名单,添加备注,管理分享权限等。

(3)音频设置功能。可以管理配置音频信号的输入输出通道。

(4)通话记录查询、统计功能。可以按时间、用户查询、统计通话记录。

2.4.2 导控功能

导控软件可实现以下具体操作。

(1)连线开关。导播、主持人可以设置连线的开启与关闭状态,同时可以对连线的话题、连线结束时间以及最大参与人数进行设置。

(2)连线处理。导播、主持人可以使用鼠标对连线进行接通操作、转入直播间、转入导播间、挂断、标记(对连线者身份、连线内容等进行备注,以便主持人提前了解连线的大概情况,导播在连线结束后进行资料整理)、等待及加入黑名单。

(3)多方通话。主持人和导播都可以同时接通2 个及以上连线,系统自动进入多方通话模式。此模式下,主持人可以使用锁定通话、挂断、标记、静音、单聊、群聊以及加入黑名单等功能。

(4)主持人导播信息互动。主持人和导播可以通过互动区进行文字交流,可以发送天气、路况、通知及紧急事项等信息。

(5)热线留言。可以显示连线关闭期或者繁忙期、用户通过小程序发出的语音和文字留言,同时还能播放语音留言。

导控软件主界面如图3 所示。

图3 导控软件主界面

导控系统软件主界面分为功能区、连线控制区以及互动区三个主要部分。

功能区位于整个界面的最上方。功能区的最左侧图标显示网络信号强度,右侧分别设有直播间导播间显示、设置、房间管理、重新登录、帮助、退出等功能按钮。

连线控制区位于功能区下方左侧,从左到右依次排列为直播间通话列表、导播间通话列表、排队列表三个区域。主持人和导播登录系统时选择各自房间,就可以在相应通话列表进行操作。

互动区位于功能区下方最右侧。互动区又分为上下两个部分。上半部分是热线留言区,按时间顺序混合显示听众的语音和文字留言,并可以播放听众的语音留言。下半部分是主持人导播互动区,主持人和导播可以进行文字互动。

3 结语

全新设计的广播节目互联网语音互动系统可以传输48 kHz 采样率的双通道全频带128 kb·s-1码率的高保真音乐信号,可以支持50 人同时开启麦克风,并具有不高于300 ms 的端到端延时,日常基本在100 ms 左右,人耳感知并不明显。相较于传统电话语音信号300 Hz~3.4 kHz 的频率范围,该系统支持20 Hz~20 kHz 的语音信号传输,将与听众连线互动的音质提升到了高保真级别,特别适合音乐唱K 打擂节目,同时普通的语音连线清晰度大幅度提升。在未开热线的情况下,听众能通过小程序进行留言,丰富了互动的手段,拓展了互动的时效。同时,互动小程序还能通过微信分享,主持人可以将其分享到各个粉丝群中,即可轻松实现裂变传播,提高了节目的传播范围。该系统使用AoIP信号实现台内音频信号传输,传输介质轻便且价格低廉、传输容量大,抗干扰能力强,还具有冗余和后期扩容的能力。该系统不仅能进行直播节目的热线语音互动,还可以在录制节目时进行远程连线采访,进行外场直播节目的传输。该系统凭借高保真、低时延、宽时效、操作简单、具备互联网传播能力等特点,为广播的媒体融合提供了助力。

猜你喜欢
控系统连线音频
On Doors
Egdon Heath (Extract from The Return of the Native)
一种基于自主发射控制的运载火箭地面测发控系统设计
快乐连线
基于单相回路及热泵回路的月球居住舱热控系统对比分析
快乐连线
关于DALI灯控系统的问答精选
柏韵音频举办Pureaudio 2021新产品发布会
中小水电站集控系统建设改造对策分析
快乐连线