来源:人民日报海外版 语言、大脑和计算机接口技术与人工智能、体智能技术的融合。图片提供:中国科学院上海微系统与信息技术研究所 图片提供:中国科学院上海微系统与信息技术研究所 中文句子实时解码。近期,中国科学院上海微系统与信息技术研究所及相关团队在语言脑机接口领域取得突破。研究人员开发了灵活、可集成、高性能的脑机接口系统和实时中文神经网络解码算法,首次实现了使用脑机接口对现实世界进行实时中文句子解码和合成。这项研究不仅让中国失语症患者重新“说话”,还开启了为脑机接口在多语言、多场景下的应用提供新的可能。破译任何汉字或文本的能力是人与人之间交流的主要形式。然而,严重的脑部疾病,如中风、ALS、脑外伤等,往往会导致患者丧失语言表达能力,陷入有意识却无法说话的困境。 “中国有近800万患者因各种脑部疾病而丧失语言能力,中文解码对于他们来说具有重要的意义和应用价值。”中科院上海微系统与信息技术研究所研究员周志涛表示,近年来,不少国际顶尖科研团队在脑机接口英文解码方面取得不少进展,其中包括英语和西班牙语双语解码。然而,对汉语破译的研究却十分困难。由于与英语不同且用户数量最多,但起步较晚,因此研究进展相对缓慢。周志涛表示,团队此次研究的主要突破主要包括两点。 “首次实现了中文实时解码,实现了几乎覆盖中文所有音节的全谱解码。”与英语相比,汉语有自己的特点。具体来说,英语主要是多音节和无声调语言,而汉语主要是单音节和声调语言。同时,英语词汇量也十分丰富,常用英语单词约有20个,单词量达上千个。而汉语则有大约 400 个音节和 4 个声调,可以组成 3500 多个常用汉字来满足日常需要。汉语的独特性也有其优点。研究团队从这些汉语音节和声调入手,将它们作为稳定的中间德编码单元实现脑电波“翻译”成文本。英语很难直接破译大量的单词,而汉语可以破译这些汉语音节和声调,涵盖所有的发音组合,进而破译汉字和句子。 “音节+声调”解码策略着眼于汉语特点,研究团队提出了以“音节+声调”为主的中间解码单元。研究人员表示,与音素相比,音节是更完整、更充分的发音单位,具有更长的持续时间和更稳定的神经表征,这对于从脑电信号中提取显着特征非常有用。同时,在直接解码音节时,可以跳过重新组合声母和词尾的复杂中间步骤,大大提高了解码效率。在具体实施上,研究团队构建了多evel实时解码数据流,在50 ms的滑动窗口中提取70 Hz至170 Hz的高伽马带脑电信号,并将脑电信号与发音起点对齐,驱动双流解码器同步生成音节和声调概率。然后集成语言模型以选择最优化的句子组合并实现实时中文句子生成。这个过程就形成了“EGG→音节→汉字→句子”的闭环。研究表明,受试者完成为期9天的语言解码任务后,对394个汉语音节(不进行解码的音节为受试者罕见且未知的音节)进行纯神经解码的平均准确率达到71.2%,单音节解码延迟达到65毫秒,实时汉语句子解码速度达到49.6字/分钟。在此基础上,团队进一步将语言脑机接口与人工智能、嵌入式智能技术相结合基于内部研发的通用脑机操作系统,实现多种新型交互方式。例如,受试者可以使用解码脑电图来驾驶和挤压黄油。直接与大规模人工智能模型交互。解码后的语言还可以翻译成控制指令,实时控制右手,完成抓取等动作。拓展“说话”的极限“AI时代的语言解码不再局限于简单地进行“说话”。周志涛认为,语言解码还可以增强人类自身的能力,使人成为“超人”,极大地拓展人的想象力和控制交互的可能性。“脑机语言接口充当控制中心和信息中心。通过上述以及未来各种新的交互方式的实现,将帮助人们高效地控制和协作对于临床应用而言,脑机语言接口仍面临诸多挑战。例如,如何长时间稳定移植、长时间保持高质量的脑信号采集、减少组织反应等。此外,中文神经编码机制本身还需要进一步研究。研究团队表示,下一步将优先使用最新的全无线可植入设备——全功能脑机接口装置进行长期植入实验,实现实时无声解码,进一步提高实时性。解码率和准确率(记者周淑云)人民日报海外版(2026年1月21日第10页)。
特别提示:以上内容(包括图片、视频,如有)由自有资金平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
否te:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。