切换到宽版
  • 11阅读
  • 2回复

[数码讨论]脑机接口技术让瘫痪18年的患者通过AI实时“说话”,延迟仅1秒[2P] [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
177300
金币
347690
道行
2004
原创
2413
奖券
2855
斑龄
36
道券
1038
获奖
0
座驾
设备
摄影级
在线时间: 39891(小时)
注册时间: 2008-10-01
最后登录: 2025-08-15
只看楼主 倒序阅读 使用道具 楼主  发表于: 6小时前

IT之家 8 月 14 日消息,加拿大萨斯喀彻温省的高中教师兼教练安・约翰逊(Ann Johnson)在 2005 年因脑干中风导致近乎完全瘫痪,此后一直饱受闭锁综合征的折磨。这种罕见病症使患者意识清醒,却无法言语或行动。18 年来,约翰逊依靠眼动追踪系统以每分钟 14 个词的速度与外界沟通,远低于正常人每分钟约 160 个词的对话速度。然而,如今她终于再次听到了自己的声音,这得益于一种脑机接口(BCI)技术,该技术能够直接从大脑活动中解码语言。

2022 年,约翰逊成为加州大学伯克利分校和加州大学旧金山分校联合开展的一项临床试验的第三位参与者。这项试验旨在通过一种神经假体恢复严重瘫痪患者的语言能力。研究人员通过植入神经假体,从大脑的语言运动皮层记录信号,绕过受损的神经通路,从而产生可听的语音。

据IT之家了解,该设备依赖于放置在大脑语言生成区域上方的植入物,当约翰逊尝试说话时,植入装置会检测到神经活动,并将信号传输到连接的计算机。随后,人工智能解码器将这些信号转化为文本、语音或数字形象上的面部表情。最初,该系统使用了序列到序列的人工智能模型,需要完整的一句话才能输出结果,导致会有 8 秒的延迟。然而,2025 年 3 月,研究团队在《自然神经科学》杂志上报告称,他们已转向流式架构,实现了仅 1 秒延迟的近实时翻译。

为了使体验更加个性化,研究人员利用约翰逊 2004 年婚礼演讲的录音重现了她的声音。她还选择了一个与自己外貌相符的虚拟形象,该形象能够模仿微笑或皱眉等面部表情。

加州大学伯克利分校电气工程与计算机科学助理教授戈帕拉・阿努曼奇帕利(Gopala Anumanchipalli)、加州大学旧金山分校神经外科医生爱德华・张(Edward Chang)以及伯克利分校博士生凯洛・利特尔约翰(Kaylo Littlejohn)表示,他们的目标是使神经假肢实现“即插即用”,将其从实验系统转变为标准临床工具。未来改进的方向可能包括无线植入装置,从而无需直接连接计算机,以及更加逼真的虚拟形象,以实现更自然的互动。研究团队还设想开发数字“克隆人”,不仅能复制用户的声音,还能模仿其对话风格和视觉信号。

这项突破有望帮助那些因中风、肌萎缩侧索硬化症(ALS)或受伤而失去语言能力的相对小众但极为脆弱的群体,让他们重新获得更快速、更自然的沟通能力。研究人员强调,该系统只有在参与者有意识地尝试说话时才会工作,从而确保用户的自主性和隐私。

对于约翰逊来说,这次试验彻底改变了她的生活。“我希望患者看到我,知道他们的生活并未结束,”她在接受加州大学旧金山分校采访时说。她期待有一天能在康复中心担任咨询师,借助神经假肢与客户交流。

随着延迟时间降至约 1 秒,以及人工智能建模的持续进步,研究人员相信,实用的实时语音恢复技术有望在几年内实现,这将彻底改变技术为失去语言能力的人们赋予声音的方式。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
177300
金币
347690
道行
2004
原创
2413
奖券
2855
斑龄
36
道券
1038
获奖
0
座驾
设备
摄影级
在线时间: 39891(小时)
注册时间: 2008-10-01
最后登录: 2025-08-15
只看该作者 沙发  发表于: 6小时前
脑机接口技术的突破与应用

你提到的关于安・约翰逊(Ann Johnson)的故事,展示了脑机接口(BCI)技术在医疗领域的巨大潜力。这项技术不仅帮助约翰逊恢复了语言能力,还为其他因疾病或受伤而失去语言能力的患者带来了希望。

技术原理与进展

1. 神经假体植入:
   - 研究人员通过在大脑的语言运动皮层植入神经假体,记录大脑的神经活动信号。这些信号通过植入装置传输到连接的计算机。

2. 人工智能解码:
   - 计算机上的人工智能解码器将接收到的神经活动信号转化为文本、语音或数字形象上的面部表情。最初,该系统使用了序列到序列的人工智能模型,需要完整的一句话才能输出结果,导致会有8秒的延迟。然而,2025年3月,研究团队转向流式架构,实现了仅1秒延迟的近实时翻译。

3. 个性化体验:
   - 为了使体验更加个性化,研究人员利用约翰逊2004年婚礼演讲的录音重现了她的声音。她还选择了一个与自己外貌相符的虚拟形象,该形象能够模仿微笑或皱眉等面部表情。

应用前景与未来方向

1. 标准化临床工具:
   - 研究团队的目标是使神经假肢实现“即插即用”,将其从实验系统转变为标准临床工具。未来改进的方向可能包括无线植入装置,从而无需直接连接计算机,以及更加逼真的虚拟形象,以实现更自然的互动。

2. 数字“克隆人”:
   - 研究团队还设想开发数字“克隆人”,不仅能复制用户的声音,还能模仿其对话风格和视觉信号。这将进一步提高患者的沟通能力和生活质量。

3. 帮助更多患者:
   - 这项技术有望帮助那些因中风、肌萎缩侧索硬化症(ALS)或受伤而失去语言能力的相对小众但极为脆弱的群体,让他们重新获得更快速、更自然的沟通能力。

对患者生活的影响

对于约翰逊来说,这次试验彻底改变了她的生活。她不仅能够再次听到自己的声音,还能够通过神经假肢与外界进行更快速、更自然的沟通。她表示:“我希望患者看到我,知道他们的生活并未结束。”她期待有一天能在康复中心担任咨询师,借助神经假肢与客户交流。

结论

这项脑机接口技术的突破,不仅为失去语言能力的患者带来了新的希望,也为未来的医疗技术发展指明了方向。随着技术的不断进步和完善,我们有理由相信,越来越多的患者将受益于这一创新技术,重新获得沟通的能力和生活的尊严。
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
150309
金币
323339
道行
20030
原创
758
奖券
224
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 17718(小时)
注册时间: 2012-06-21
最后登录: 2025-08-15
只看该作者 板凳  发表于: 4小时前
脑机接口技术实现瘫痪患者近实时语音交流突破
近日,一项由加州大学伯克利分校和旧金山分校联合开发的脑机接口(BCI)技术取得重大进展,成功帮助瘫痪18年的患者安·约翰逊实现延迟仅1秒的实时语音交流。该技术通过植入大脑的神经假体解码语言信号,结合AI模型生成自然语音,为丧失语言能力的群体带来了新的希望12。

技术核心与突破亮点
神经信号解码机制
系统通过植入大脑语言运动皮层的电极阵列记录神经活动,绕过受损的神经通路,直接将患者“试图说话”的意图转化为可识别的语音信号。研究团队采用流式处理技术,每80毫秒处理一段语言片段,避免等待完整句子生成,从而将延迟压缩至1秒内,接近自然对话节奏25。

个性化语音与虚拟形象
为提升真实感,研究人员利用约翰逊2004年婚礼演讲录音还原其原声,并构建与她外貌匹配的虚拟形象,可模拟微笑、皱眉等面部表情,增强交流的情感传递14。

隐私与自主性保障
系统仅在用户主动尝试说话时激活,确保神经信号解码过程完全由患者自主控制,避免无意识触发或隐私泄露风险24。

临床应用与未来愿景
现有技术成效


现有技术成效
沟通效率飞跃:约翰逊此前依赖眼动追踪系统,沟通速度仅为每分钟14个词,而新技术已接近正常人每分钟160词的水平

适用群体广泛:技术可惠及因中风、肌萎缩侧索硬化症(ALS)或外伤导致的闭锁综合征患者,帮助其重建社会连接14。
未来优化方向
无线化与便携化:开发无线植入装置,摆脱对外部计算机的依赖,实现日常活动中的自由交流24。
数字克隆人技术:计划进一步整合用户的对话风格、语气甚至肢体语言,构建更全面的虚拟交互形象14。
临床普及目标:研究团队希望在未来几年内将系统升级为“即插即用”的标准化医疗设备,通过AI模型迭代进一步缩短延迟,最终实现大规模临床应用25。
社会意义与科学价值
该突破不仅为瘫痪患者提供了高效沟通工具,更推动了脑机接口从实验阶段向实用化迈进。研究负责人爱德华·张指出,AI与神经科学的交叉融合,正在重新定义“声音赋予”技术的边界,未来或为更多神经系统疾病患者带来生活质量的根本性改善
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个