据美国每日科学网站近日报道,有史以来第一次,美国科学家研制出的一套新系统,借助语音合成器和人工智能,通过监控某人的大脑活动,将其想法直接转化成了可理解、可识别的语音。研究人员称,最新研究为那些言语能力有限或无法说话的人重新获得与外界沟通的能力奠定了基础,也有望为计算机直接与大脑通信开辟新途径。
几十年的研究表明,当人们说话(甚至想象说话)时,大脑中会出现明显的活动模式。当我们倾听某人说话或想象聆听时,大脑也会出现可识别的信号模式。专家们试图记录和解码这些模式,希望将人们的想法翻译成口头语言。
但实现这一壮举极具挑战性。以前科学家进行的脑部信号解码工作主要集中于构建一些用于分析频谱图(声音频率的视觉表示)的简单计算机模型,但这种方法不能产生任何类似于可理解的语音的东西。哥伦比亚大学莫蒂默·B.祖克曼心脑行为研究所的莫斯尕拉尼团队因此求诸声码器,这是一种计算机算法,可在接受人们说话的录音训练后合成语音。
为了教声码器解释大脑活动,莫斯尕拉尼与神经外科医生阿希什·迪勒希-梅塔合作。在研究中,他们要求接受过脑部手术的癫痫患者听取不同人说的句子,同时测量他们大脑的活动模式,这也是对声码器进行训练。
接下来,他们要求这些患者听说话者复述0到9之间的数字,同时记录可以通过声码器运行的大脑信号。然后,再借助模仿生物大脑中神经元结构的人工智能——神经网络,对声码器响应这些信号所产生的声音进行分析。
莫斯尕拉尼说:“我们发现,这些人可以理解并重复75%的声音,远超以往任何尝试。”
研究人员计划接下来测试更复杂的单词和句子。他们希望该系统可以成为植入物的一部分,将穿戴者的思想直接转化为文字。
莫斯尕拉尼说:“这将改变游戏规则。它有望让任何失去讲话能力的人,重新拥有与周围世界联系的机会。”