深度挖掘沉浸式音频技术

2019-06-13 17:49:04 信息化视听2019年5期

熟悉的“更快、更高、更强”奥运会格言不仅适用于奥运会运动员,也适用于普通男性(和女性):黑白电视机曾被认为是轰动一时的产品,为观众打开了一个全新的维度,接着是彩色电视的出现。与此同时,电影屏幕变得越来越高、越来越宽。这与从单声道到立体声的转换以及一系列惊人的图像质量大幅提高是携手并进的。虽然4K仍在实施过程中,但更大胆的早期采用者已经在为他们的8K服务做准备。

在音频领域也出现了类似的飞跃式发展,并且被认为是娱乐业和广播行业的天赐良机。这些行业的运营商一直在寻找新的方式,用更多令人惊叹的手段吸引观众。只要想想20世纪70年代初的四声道立体声,或者5.1环绕立体声的体育、音乐会转播和电视广播节目就知道了。虽然立体声很快成为电影院标准,但最终环绕立体声电视节目仅仅进入了数量令人失望的家庭影院——绝大多数家庭的客厅仍然是一个“禁飞区”,主要是由于空间和实际的原因。这似乎让人们对环绕立体声(5.1、7.1、杜比环绕等)看似光明的远大期望暂时平息下来。

命运作弄

永远抱着希望,无数的公共广播公司和广播机构继续投资5.1音频,甚至到了不再能够向“只有”两个HiFi音箱的观众提供“正确立体声”的程度。他们只能寻求原始多声道格式下变换。

主要调音台制造商非常愿意伸出援手,很快就推出了5.1-母线的台子。不过,朗沃(Lawo)公司更进一步,早在2003年,朗沃就放弃将其mc2系列调音台限制于每条母线只有固定数量的多条通道。德国拉施塔特(朗沃公司所在地)的工程师确实意识到,要获得令人信服效果的3D音频,需要Z轴进行垂直定位,因此需要6个以上的通道。一些人将这种方式称为“9.1”,另一些人将其称为“5.1.4”、“7.1.4”等等。

2012年伦敦奥运会上,日本公共广播公司NHK推出了其“Super Hi-Vision”项目,该项目依靠22.2个频道,将革命性的8K画质与真正沉浸式的音频体验相配合。

朗沃公司利用开发其沉浸式混合引擎(LIME)的经验——允许在基于通道和对象的3D场景中,使用2003年以来制造的任何mc2调音台,在该项目实现中发挥了重要作用。

这似乎标志着沉浸式音频技术光明未来的开始,特别是鉴于目前有丰富的3D解决方案:Dolby Atmos、MPEG-H、AURO-3D、DTS:X、NHK 22.2、IMAX 6.0和12.0以及Sennheiser AMBEO 9.1和更高版本。这项技术绝对是可行的,而且有明显的迹象表明,2019年将有新进展公布。

唯一的障碍是,这种身临其境的超凡技术被普遍采用的程度如此之低,以至于一些广播公司正认真考虑以不合理成本的理由关闭它们的5.1声道。怎么会这样?

实用性先于沉浸性

主要原因似乎是消费者不得不等到2019年他们才可以合理地分享这些进展:由于两个以上音箱(最好隐藏于电视机内)根本不是大多数家庭中的选择,因此一些制造商开始开发条形音箱以及为耳机开发双耳信号处理工具。这两种聆听解决方案的优点是它们几乎不需要空间,同时提供一种沉浸式体验,这种体验非常可信,以至于任何尝试过这种方法的听众都永远不想回到二维立体声世界。

因此,提供一种消费者友好架构对沉浸式音频技术和任何“新”播放格式取得成功至关重要。现在广播和电视频道计划全速前进,用同样丰富的音频还原配合它们卓越的画面质量看来是明智的。因此,好消息是各种难题都在慢慢得到解决,内容提供商和消费者很快就会开心不已。

不光如此,基于对象的方式还提供更多好处,消费者很快就能根据自己的喜好调整声音电平平衡,即个性化他们的聆听体验。对于那些希望提高对白的可理解性而不想将整体播放电平提高到与环境不相容的程度的人员来说,这将非常方便。其他选择将包括有效地静音评论,以获得未经过滤的现场体验。音频信息确实是作为不同的通道组(或主干)提供的,其电平可以单独调整。内容提供者可以自行决定他们想要使用这些附加选项走多远。

这对制作方面意味着什么?

目前的趋势似乎表明,沉浸式音频领域最终将分为两个地域——亚洲和世界其它地区:在美国和欧洲,Dolby Atmos 正在扩大自己的影响力,而韩国和中国则在关注MPEG-H。在全球范围内运营的调音台制造商必须需要灵活适应这种情况。这就解释了为什么朗沃的混录调音台可以直接使用由杜比DP950和MPEG-H处理器生成的混音和缩混,让音响师可以轻松地检查所有的处理程序是否达到了预期的效果。

由于其特有的设计,LIME的用户界面可以从任何mc2调音台远程控制,这与朗沃在一个地点(也就是从调音台)提供全面控制的愿望一致。这种适用于对象、OTT内容、双耳混音、声像个性化等的沉浸式方式意味着音频工程师需做更多的工作。例如,音频内容在各种平台(电视广播、有线电视、互联网流媒体)上被消费,并且需要在所有平台上听起来都令人信服这一事实,要求比以前有更多的监控。而我们甚至还没有提及在大部分处理参数只能在外置设备上调整时的紧张情况下可能出现的错误。

朗沃设备最受赞赏的特性之一是其用户友好性。朗沃调音台以其提供的帮助闻名遐迩,这在日益复杂的工作流程中尤为重要。Automix和音频跟随视频等功能通常被认为是理所当然应有的。

通过2015年发布的软件KICK,朗沃增加了基于外部跟踪数据的mc2通道自动控制。德国足球甲级联赛已经强制要求在足球场上使用这种“清脆”、近距离拾音的音频系统,因为高度复杂的混音操作必须在没有失真或相位错误的情况下进行。KICK的可靠性使得自动化程序在整个比赛期间始终绝对可靠,一直到加时赛和随后的点球大战:所有电平平衡保持一致和可重复,为音效工程师(AR1)留出更多时间来完成其它重要任务,如总混音。

在消费者需要实现客观的优势之基于对象的服务中,一致性甚至更为重要。个性化将很快允许消费者改变电平平衡。然而,這只有在提供的音频对象是专业级的情况下才有意义。为获得令人满意的聆听体验,交叉衰减、电平跳变和串扰是内容提供者需要不惜一切代价避免的失真。

永无止境

沉浸式音频采用日益增加到处都可感受到——拥有先进的3D音频技术的新影院数量几乎每天都在增长。新一代条形音箱看来有太多的优点,消费者接受沉浸式3D还音无可争辩的优势只是时间问题。为耳机优化的沉浸式格式将进一步激发需求。

广播公司在不久的将来将提供的交互、基于对象的格式的吸引力不可低估。它最好的副效用就是每个消费者都可以通过增强一些信号(和减弱其它信号),在不丢失重要信息的前提下减少基于对象元数据的作用,或者重现他们记忆中的体育场、剧场内的现场气氛,来塑造自己的聆听体验。这些因素相结合为市场提供了巨大的潜力,而广播公司将乐于迎合这些新的期望。

通过把所有相关控制功能无缝集成到其mc2调音台,朗沃支持采用沉浸式音频,并将在不久的将来推出新的解决方案。下一届奥运会和其他备受瞩目的活动即将到来。因此,现在该是有关各方行动起来的时候了。

从朗沃的观点来看,2019年沉浸式音频将会被广泛接受。请继续关注朗沃今年晚些时候的产品发布!