a tall building lit up at night

微软亚洲研究院

王延森:所有科学发现都是人类情感需求的投射

已发布

编者按:当“理性”的科学发现与“情感丰富”的科研人员相遇,会发生怎样的化学反应?

在人工智能与神经科学的交汇处,微软亚洲研究院高级研究员王延森,正怀揣着浓厚的兴趣,聚焦人的需求与体验,展开一场关于智能本质的探索。他以非侵入式脑机接口为钥匙,试图破解人类感知与意图的神经密码;以脉冲神经网络为桥梁,探索人脑低能耗运行的奥秘;秉持“以人为本”的初心,让技术回归服务于人的本质。跟随王延森的脚步,我们将见证一场人工智能与神经科学的“双向奔赴”。


“人类的兴趣是科研发现的第一驱动力。所有现有的工具,归根结底都是人类情感需求的投射。”在微软亚洲研究院的面试中,王延森如此回答。这句话不仅道出了他从事科学研究的内在信念,更成为他此后在人工智能与神经科学交叉领域不断深耕的精神注脚。

对王延森而言,科研的种子在他少年时期便早已种下。初中时,当同学们还在为信息检索耗费大量时间时,他就用几行爬虫代码轻松解决了问题。他尝试通过编程快速解决复杂的计算问题。这种“用技术创造便捷、收获成就感”的正反馈,让他对计算机产生了浓厚的兴趣。随着学习和研究的深入,他的目标逐渐清晰:不仅追求技术上的突破,更希望让科技真正服务于人。

微软亚洲研究院高级研究员王延森
微软亚洲研究院高级研究员王延森

正是这份“以兴趣为引,以人为本”的初心,指引着王延森一步步踏上科研征途。在清华大学就读本科时,王延森见证了人工智能战胜世界围棋冠军的历史性时刻。那一刻,他意识到,人工智能或许不仅能赢下棋局,更有可能理解人类的思维模式。带着这份思考,他在硕士阶段前往卡耐基梅隆大学,深耕多模态研究。

毕业后,王延森加入了微软亚洲研究院(上海)人工智能与机器学习组。在这里,他真正开启了人工智能与神经科学融合的科研创新之旅。

人工智能与神经科学的双向奔赴

王延森目前的研究聚焦于人工智能与神经科学这一交叉领域的两个核心方向:一方面,利用人工智能促进神经科学的发展,帮助人类理解大脑的运作机制,即 “AI for Brain”;另一方面,从大脑的智慧中汲取灵感,反哺人工智能的架构与算法,即 “Brain for AI”。

在 “AI for Brain” 的探索中,王延森和同事们以非侵入式脑机接口为研究载体。“人类对大脑的了解现阶段仍然非常有限,它的多任务处理能力、对环境的快速适应能力,至今都是人工智能难以企及的高度。我们希望借助人工智能分析脑电信号(EEG),建立人类对外界感知与意图和大脑活动之间的关联,从而理解大脑的工作机制。”王延森解释道。

目前,团队已在非侵入式脑机接口研究中取得阶段性成果。在感知端,他们实现了对人类视觉粗粒度信息的初步解码,如识别受试者所见的颜色、动态场景等信息。通过运用先进的扩散模型,团队成功将神经信号转化为语义匹配的视觉内容,并推出了基线模型 EEG2Video,能够从脑电信号中“重建”人脑所感知的视频片段。为提升模型的泛化能力,王延森和同事们还构建了多个数据集,将脑电信号与日常行为动作进行系统性关联,推动技术走向更多应用场景。

demo
demo
EEG2Video demo(上图为原始视频输入;下图为 EEG2Video 重构视频)

相关论文:EEG2Video: Towards Decoding Dynamic Visual Perception from EEG Signals (opens in new tab)

在控制端,针对“字母解码”难题,王延森与团队创新性地提出了“编码本”范式。不同于传统方法要求参与者在脑中想象字母形状,该范式引导参与者想象肢体动作、数学计算等更易被设备识别的语义信息,再通过人工智能将这些语义与字母关联。在所使用的便携式设备中,这一范式已在36分类任务(涵盖26个字母与10个数字)上实现了30%–40%的准确率。“目前,我们正努力将这一范式拓展至手机操控和网页交互等场景,探索除字母输入之外的多元交互模式,进一步拓展其应用边界和实用价值。”

然而,王延森也指出,非侵入式脑机接口的实现依然面临不少挑战:脑电信号信噪比低,极易受到环境与其他生理信号的干扰,难以在便携设备上稳定提取;脑电数据稀缺,且采集需要在受控环境下进行;个体差异显著,导致跨用户、跨任务的通用性不足。

“我们正在推进‘脑电基础模型’的研究,希望可以像大语言模型一样,通过更多数据和更大规模的模型来提升系统的鲁棒性。”王延森补充道。

在 “Brain for AI” 探索中,王延森和同事们希望从人脑的功能与运作中汲取灵感,以应对人工智能在能效方面的挑战。

“人脑仅需一碗饭的能量,就能完成大量思考与计算,但人工智能却需要消耗大量资源和电力才能获得不错的结果。”王延森指出,“更值得深思的是,人脑在许多任务中无需复杂网络即可高效完成,比如手部或肢体的精细控制。人类也能在少量样本下快速适应新任务,但现有人工智能模型往往需要海量数据才能重新学习。这些差异背后,一定存在可供人工智能借鉴的设计逻辑。”

团队的研究发现,这其中最显著的差异在于神经元的结构与工作方式。人脑神经元采用脉冲式机制,只有当膜电位累积至特定阈值时,才会激发并传递信号,在静息状态下,能耗极低。而传统人工神经网络无论输入强弱,始终进行稠密计算,导致能耗居高不下。

基于这一发现,王延森和团队改进了脉冲神经网络(Spiking Neural Network, SNN)框架。在时序预测任务中,SNN 的性能与传统人工神经网络相当,但理论能耗可降低至后者的四分之一,为低功耗人工智能发展提供了新路径。

diagram
图:在时间序列预测中的 SNN 框架

相关论文:Efficient and Effective Time-Series Forecasting with Spiking Neural Networks (opens in new tab)

“这只是研究的一部分,”王延森补充道,“人脑神经元之间是稀疏连接的,一个神经元通常只与周围少数神经元建立联系,而人工神经网络中,单个神经元连接上千个其他神经元,这种稀疏连接也能带来能耗的降低。未来,若能持续借鉴人脑的工作模式,人工智能将会更加通用、更加节能。”

Yansen Wang
图:王延森在 TEDxBeijing 创新会议上进行分享

跨学科破界法:从“门外汉”到领域深耕者

人工智能与神经科学的交叉研究对王延森而言,是一片全新的领域。他此前并未系统学习过神经科学或脑电相关的知识,但凭借独特的学习方法、积极的跨领域合作,以及团队的有力支持,王延森成功实现了从“门外汉”到领域深耕者的转变。

换位思考,抛开原有路径。初入脑电研究领域时,王延森主动向合作的医生请教,并翻阅了专业教材。“当时我给自己定了个规矩,暂时抛开人工智能的思维,把自己当成一名医生,完整‘啃’一遍医学教材,先学会读脑电信号。之后,再思考人工智能可以在其中发挥什么作用。”这种“换位思考”的学习方式,让他跳出了思维惯性,真正理解了临床问题的本质。

在跨界合作中碰撞,发现“数据”之外的智慧。跨学科合作并非简单的知识叠加,而是思维范式的碰撞。在癫痫检测研究中,王延森发现人工智能和医学领域的认知存在一定差异。人工智能领域的科研人员往往认为,只要数据足够,模型就能学会捕捉癫痫发作的特征,如棘波和慢波。但医生凭借经验,能够在嘈杂的脑电信号中迅速识别出那1%的异常。然而,模型即便见过再多数据也可能对此“视而不见”。“这让我意识到,机器学习的进步并不能只靠‘力大砖飞’。在医疗等数据稀缺的场景中必须结合领域专家的先验知识,引入归纳偏置(inductive bias),才能真正提升模型的有效性。”

系统学习,构建知识体系。为帮助研究员系统掌握跨领域知识,微软亚洲研究院(上海)成立了“神经科学学习小组”。每周安排一天的公开课,课后布置作业并组织讨论。持续半年的学习,让王延森不仅系统掌握了神经科学的基础知识,也从资深研究员那里获得了宝贵的实战指导。“这种集体学习的氛围,让我们不再是孤军奋战的‘跨界者’,成为了一个共同成长的‘学习共同体’。”他说。

开放氛围,激发科研创新。微软亚洲研究院始终倡导自由探索与开放交流的文化。在上海实验室每周的 “Grand Challenge” 会议中,研究员们会“毫不留情”地对彼此的研究提出尖锐问题。王延森坦言:“最初我并不太适应这种‘撕破脸皮’式的讨论。但后来发现,正是这些质疑暴露了思维盲点,让研究可以在反复打磨中走向深入。最锋利的批评,往往孕育着最深刻的创新。

a group of people in a meeting
图:王延森(右三)与同事们探讨科研问题

科研的温度:以人为本的人工智能探索与坚守

在王延森的科研理念中,技术应是服务于人的载体。无论是脑机接口的研究,还是正在进行的围棋人工智能可解释性的研究,他始终坚守“以人为本”的核心,让人工智能不仅有“智能”,更有“温度”。

2022年前后,王延森和同事们发起了一个“人类拯救计划”。当时,人工智能在围棋领域已远超人类顶尖棋手,职业棋手因此陷入了焦虑。尽管人类可以模仿人工智能的棋谱,却无法理解“为什么这么下”,只能机械记忆,难以形成思考体系。“我在想,如果能让人工智能把自己的‘下棋逻辑’解释给人类,那么棋手就能真正理解其背后的策略。”王延森说,“我们这个计划的初心很简单,就是希望人类可以在与人工智能的共存中变得更强。”

对王延森来说,科研的动力从来不是论文的数量,而是那些真实可感的回响:可能是棋手“看懂”一步妙手时的豁然开朗,可能是为日常生活提供更便捷的交互方式,又或者是为人工智能的可持续发展开辟一条新的路径。让技术真正懂人,是他不变的追求。“而在微软亚洲研究院,我得以追随兴趣,同时与伙伴们共同解决那些对人类有意义的问题。”

继续阅读

查看所有博客文章