为什么是39.15比特每秒

2019-08-03 04:58
时代人物(新教育家) 2019年9期
关键词:语速传输速率音节

在刘慈欣的《乡村教师》中,人类因“令人难以置信的每秒1至10比特” 的交流速率而备受高级文明“鄙夷”,以致怀疑其文明的真实性。而最新科学研究给出了一个“失望”的答案——人类语言传输速率相同,为每秒39.15比特。这一答案可能还会使更多问题失效,比如,语言、文明有高下之分吗?

2019世界人工智能大会,马云和马斯克对话引发热议。2017年,马斯克成立神经科技公司Neuralink,其目的即为“开发超高带宽的脑机接口”,人类可以像电脑一样存储信息

语速和信息密度成反比

研究语音的“带宽”,即信息速率,最核心的问题是计算不同语言单音节的信息量。早在1951年,信息论创始人香农就已经开始研究英语书面文字的信息熵问题。

里昂大学在2011年发表论文,统计世界上几种主流语言的信息密度和语速,最后将二者相乘算出传输速率。最近,他们把研究范围扩展到9个语系17种语言,包括越南语、英语、德语、意大利语、法语、日语、韩语、汉语普通话和粤语等。

研究人员收集了上述17种语言的170名当地成年人的录音,分别以正常速率阅读一组语义相似的标准化文本,总共大约24万个音节。演讲者会事先阅读熟悉文本,最大限度减少阅读错误。如此全面地统计研究17种主流语言的信息密度,这还是第一次。

研究人员发现,日语只有643个音节,每个音节的信息密度约为5比特;英语的音节数量为6949,每个音节的密度为7比特;越南语最为复杂,平均每个音节包含8比特的信息,为所有语言之首。

统计后的结论是:信息速率(IR)的平均值为39.15bit/s,标准差为5.10bit/s,音节速率(SR)的平均值为6.63音节/s,标准差为1.15音节/s。

但音节信息密度越高的语言,语速就越慢。17种语言每个音节的信息密度和音节速率,二者呈高度的负相关关系,系数达-0.89。

大脑限制了语言速率

里昂大学的语言学家弗朗索瓦•佩莱格里诺说:“由于语言科学长期关注语法复杂性等问题,信息传输速率被忽略了。”而这一速率恰恰说明:尽管语言的编码策略差异很大,但在提供信息时,没有哪一种语言比另一种语言更高效。

那么,为何有这样的巧合?以及,信息密度更高的语言可以再提高语速加快传输吗?

研究人员推测,人类的大脑结构是类似的,发音器官也很接近,那么我们对语言的理解能力也相似。作者之一,丹•德迪乌猜测,可能与脑电波频率有关。

而语音受到大脑处理瓶颈的限制。最近一篇神经科学论文提出,在美式英语中人类听觉上限是每秒9个音节。这也解释了提高语言速率并不能显著提高传输速率,一般人可以听录音大约只能加速到120%,这是瓶颈所在。

(来源_量子位、Deeptech深科技)

猜你喜欢
语速传输速率音节
辩论赛之语速
三星利用5G毫米波 实现创纪录传输速率
拼拼 读读 写写
说话时语速慢点有益身心
夏季滨海湿地互花米草植物甲烷传输研究
藏文音节字的频次统计
数据传输速率
语速里的微妙心理
木管乐器“音节练习法”初探
SPCE061A单片机与USB接口