让脑电波“开口说话”

2019-08-26 05:43敖显奎
大众科学 2019年5期
关键词:脑机霍金的脑电波

敖显奎

霍金在坐上轮椅后,一开始还能通过手指敲打键盘来输出文字,后来手指无法运动了,曾想过利用眼球耕作和脑电波识别技术来帮助输出信息。但最后由于病情和技术的问题,没能完成,转而使用红外探测眼镜,这已是当下最先进的语言合成技术了。霍金直到最后都没能直接将自己的脑电波直接转换为语言,不过这一技術在不久的将来即将到来。我们从另一个角度,继续探索“脑机接口”。

脑电波“打字”的铺成

要让脑电波开口说话,需要让脑电波与字母之间建立联系。因此“打字”是一个绕不开的话题。2018年世界机器人大会上,清华大学研发的“动态窗稳态视觉诱发电位脑机接口系统”向参赛者们提供了这样一个竞赛平台:将注意力集中到电脑屏幕上的虚拟键盘中的字母上,脑电波就会被捕捉,对应的字母就会显示在屏幕上。

这种视觉打字系统是一种视觉诱发电位的打字系统,虚拟键盘中每一个目标字符在运行过程中都会有特定的频率去闪烁,目标频率都不相同,当我们注视目标的时候,大脑的枕区视觉皮层附近,会产生对应闪烁频率的脑电波信号。刺激不同,响应不同。所以可以通过采集人的脑电信号,找到相对应的目标,从而实现打字。该项目的主导人表示,这一系统平均正确率能达到91%。这种输入效率,大概等于正常人每分钟手写28个英文字母的水平,最快的人每分钟能打出60个字符。

事实上,这一系统的原理跟霍金的红外眼镜有相似之处,红外眼镜是根据霍金的一小块肌肉来捕捉信号的,二者都是通过人堆字母的强烈反应而实现语言的输出。当然,霍金的红外眼镜设备成熟得更多,打字效率也就更快。

“动态窗稳态视觉诱发电位脑机接口系统”想要步入下一阶段,需要解决的还是“敏感度”的问题——脑电波是非常敏感而且活跃的。一方面人如果注意力无法高度集中,系统就将很难对字母进行定位;另一方面人的大脑在看到字母的时候往往会不由自主地产生联想,比如看到“c”会想到“copy”或者“car”等词,这也会对系统识别产生干扰。另外,相比于英语,汉语还要经历更多的转换,需要耗费更多的时间。

万事俱备,模式已成

目前业内的脑电波语言转化主要分为四大步骤:样本收集、信号转化、虚拟声道、输出。

第一个步骤样本收集易于理解,它需要几率不同语言文字在大脑区域内的活动信号,建立一个数据库,以供后续的映射使用。这一数据库的建立的“健全度”直接影响了脑电波转换语言的准确度。这其中还得考虑同一单词的不同读音、语调等。想要建立一个“通用”的数据库,难度十分巨大。

第二步骤通过循环神经网络(RNN)的不断学习,研究者将大脑神经信号转换成了发音器官动作的信号,这些信号与发音器官的动作直接相关,比如嘴唇、下巴、舌头、喉咙等。

不过,神经网络的学习问题一直都是让业界头痛的问题,它所涉及的内容十分复杂。目前普遍的现场是虽然语音输出的速度很快,但也只有一半的句子会被识别出来。

第三步,虚拟声道。虚拟不同声音所产生的声道运动,就像汉语中双唇音、唇齿音、舌尖中音等所需要调动的不同发音部位一样,正常来说,如果模拟的发音运动模式和人正常说话时一样,那么所发的音也一定是一样的。这一步弄好了,接下来就可以输出了。(编辑/侯帮虎)

猜你喜欢
脑机霍金的脑电波
手写脑机接口 从科幻走入现实
脑机接口
马斯克和他的三只小猪
能感应人的脑电波并自动关机的电视机
脑机接口:人工智能教育应用的非主流路线
霍金墓碑上刻黑洞图案
大嘴找规律
霍金的真实
李淼:霍金肩头的橘子和苹果
悼念霍金?