Nature子刊:非侵入式脑机接口将大脑活动解码为语言输出,准确率可超八成


撰文丨王聪
编辑丨王多鱼
排版丨水成文
过去十几年,侵入式脑机接口的发展速度惊人:瘫痪患者可以通过植入大脑的电极,直接“意念打字”,甚至合成语音,实现接近正常人的交流速度。但这类技术有个绕不开的痛点:需要进行开颅手术,以植入电极。
不管是电极植入还是长期设备维护,都存在脑出血、感染的风险,很难大规模普及到普通患者身上。而非侵入式方案,例如脑电图(EEG),虽然安全,却一直受困于信号质量差、解码精度低——之前的公开基准测试中,EEG 对 4 类运动想象的分类准确率仅为 43.3%,离实用还差得很远。
有没有办法兼顾安全和性能一项最新研究给出了肯定答案——用更好的信号采集设备 + 更适配的 AI 模型,非侵入式脑机接口也能做到高精度的语言解码。

该研究以:Noninvasive decoding of typed sentences from human brain activity 为题,于 2026 年 6 月 29 日发表于 Nature Neuroscience 期刊,研究团队来自 Meta AI。
该研究开发了一种名为 Brain2Qwerty 的 AI 模型,首次实现了从非侵入式脑机接口记录的脑电信号中解码人类“敲键盘打出的完整句子”——通过脑磁图(MEG) 或脑电图(EEG) 解码打字时的脑电活动,从而“读出”他们想输入的句子。实验结果显示,使用 MEG 时的平均字符错误率仅为 29%,远优于 EEG 的 65%;最佳受试者的字符错误率甚至能低至 18%,并能完美解码训练集之外的多种句子。
这项研究大大缩小了侵入式脑机接口与非侵入式脑机接口之间的性能差距,为未来帮助无法说话或行动的患者实现安全、无创的交流打开了新的希望之门。

值得一提的是,Nature Neuroscience 论文中发布的是 Brain2Qwerty v1 版,而 v2 版可实时将脑信号翻译为句子。
实验是怎么做的?
研究团队找了 35 名健康的右利手志愿者,让他们完成一个“看句子→记句子→盲打句子”的任务——
1、先在屏幕上逐个看单词(每个词显示 0.5 秒左右,没有间隔);
2、看完后盯着屏幕中心的十字固定 1.5 秒,把句子记在脑子里;
3、最后在没有任何视觉提示的情况下,把记住的句子敲在定制的键盘上——全程不能回删改错,只能盯着屏幕中心,每敲一个键,屏幕上的小方块会转 10 度,避免眼动干扰解码。
实验中同时采集了两种脑信号:20 名参与者用 EEG(64 通道脑电图),20 名用 MEG(306 通道脑磁图)——后者虽然设备笨重、需要在屏蔽室中使用,但对皮层神经活动的捕捉灵敏度远高于 EEG,信噪比更高。
整个数据集加起来超过 5 万条句子、30 多万字符,为 AI 模型的训练提供了充足的数据。
Brain2Qwerty:三层 AI 架构破解脑信号密码
要想把脑信号“翻译”成文字,难点在于脑电信号又弱又杂,还要处理连续的时间序列信息。研究团队设计的 Brain2Qwerty 模型,刚好踩中了三个关键优化点:
第一层:卷积模块(Conv)
专门负责从 0.5 秒的脑信号窗口里提取局部特征——比如手指敲击对应的运动皮层激活模式。它还加入了一个“受试者专属层”,用来抵消不同人的脑结构、信号差异,相当于给每个人的脑信号做了个性化校准。
第二层:Transformer 模块
把整句话的所有字符预测结果串起来,利用句子的上下文信息纠错,就像我们使用输入法时的联想逻辑,解析的上一个词有助于推断接下来的词。
第三层:预训练语言模型
研究团队使用了基于西班牙语维基百科训练的 9-gram 字符级语言模型(参与者说西班牙语),相当于给模型装了一个“西班牙语语法词典”,它会结合 Transformer 的输出,最终选出最符合语言规律的字符序列。

为了验证这套架构的优势,研究团队还做了对照实验:去掉 Transformer 只剩卷积模块,性能下降明显;再去掉语言模型,准确率进一步降低。三个模块加起来,才是完整的 Brain2Qwerty。
结果有多惊艳?
先看最核心的指标:字符错误率(CER)——也就是解码出来的字符和真实字符相比,需要修改多少个字符才能完全一致,数值越低越好。
MEG 组:平均 CER 仅 29%,表现最好的参与者甚至降到了 18%。也就是准确率超过 80%,很多测试集外的陌生句子都能完美解码。
EEG 组:平均 CER 为 65%,虽然远低于之前同类研究的 75.8%,但和 MEG 组相比有明显差距。
研究团队还做了大量分析,验证了结果的可靠性——
错误大多集中在键盘上物理位置相近的按键(比如按“E”键容易错判成旁边的“W”或“R”键),说明模型确实是在解码运动皮层的手指控制信号,而不是靠“蒙”高频字符;
常见词、高频字符的解码准确率远高于生僻词、低频字符,而且训练数据越多,错误率越低,符合机器学习的规律;
参与者敲错的字符,解码错误率也会翻倍——因为动作执行出错时,运动皮层的神经信号本身就混乱了,进一步证明模型依赖的是真实的动作相关脑活动。
现在能用了吗?还差几步
虽然研究结果亮眼,但这项研究目前还是一个“概念验证”,离临床应用还有几个关键问题要解决——
1、解码仍有延迟:现在的模型需要等一整句话打完才能输出结果,未来需要改成连续流式解码,像我们打字时输入法实时联想那样,不需要等句子结束。
2、依赖按键触发:目前模型需要知道每个字符的敲击时间点来对齐脑信号,而真正的临床场景里,瘫痪患者可能无法做出实际动作,需要靠“运动想象”(想象自己在按键盘打字)来解码,这一步还需要进一步验证。
3、MEG 设备太笨重:现在的 MEG 设备需要液氦冷却,只能在固定屏蔽室使用。不过好消息是,基于光泵磁力计的新一代可穿戴 MEG 传感器正在快速发展,未来有望做成轻量化的头盔,让非侵入式脑机接口真正走出实验室。
缩小了侵入式和非侵入式脑机接口的鸿沟
在这项研究之前,非侵入式脑机接口和侵入式脑机接口在解码自然语言方面,几乎隔着一道无法逾越的鸿沟:侵入式能把字符错误率(CER)降低至 15% 左右,而非侵入式连 60% 都难达到。
Brain2Qwerty 的出现,大大缩小了差距,更重要的是,它证明了只要信号质量够好、模型设计合理,非侵入式脑机接口完全有能力解码复杂的自然语言任务。
对于渐冻症、闭锁综合征这类失去沟通能力的患者来说,这或许意味着未来不需要开颅手术,戴个轻便的头盔,就能重新和外界交流。
论文链接:
https://www.nature.com/articles/s41593-026-02303-2





点在看,传递你的品味




