News & features
Developers who are blind or have low vision have historically been limited to back-end programming, but new research suggests AI programming assistants are changing that in remarkable ways. A Microsoft Research Asia study found that developers who use screen readers…
王延森:所有科学发现都是人类情感需求的投射
编者按:当“理性”的科学发现与“情感丰富”的科研人员相遇,会发生怎样的化学反应? 在人工智能与神经科学的交汇处,微软亚洲研究院高级研究员王延森,正怀揣着浓厚的兴趣,聚焦人的需求与体验,展开一场关于智能本质的探索。他以非侵入式脑机接口为钥匙,试图破解人类感知与意图的神经密码;以脉冲神经网络为桥梁,探索人脑低能耗运行的奥秘;秉持“以人为本”的初心,让技术回归服务于人的本质。跟随王延森的脚步,我们将见证…
Vibe Coding能否赋予屏幕阅读器开发者“编程超能力”?
编者按:生成式人工智能的持续发展正在改变人与数字系统交互、执行任务及协同工作的模式。在众多领域中,软件开发无疑是变革最为显著的一个。AI 编程工具大大提升了编码效率,尤其对依赖屏幕阅读器的视力受损开发者而言,新兴的“Vibe Coding(氛围编程)”模式更是带来了前所未有的可能。 然而,屏幕阅读器用户如何与 AI 编程工具协作?这些工具又将如何赋能他们?他们在使用 AI 编程工具时是否会遇到新的…
编者按:欢迎阅读“开源上新”栏目!“开源上新”聚焦展示微软亚洲研究院最新发布的开源项目以及开源项目中的重大功能更新。作为“科研上新”的姊妹篇,“开源上新”栏目将帮助你快速了解开源项目的核心价值、关键功能与应用场景,让你能够掌握前沿技术、获取实践案例、提升开发效率,更好地将这些开源项目应用到自己的工作与研究中。 本期我们带来的是微软亚洲研究院全新开源的 Agent Lightning。它开创性地提出…
CausCell:虚拟细胞进入“白盒时代”
编者按:在生命科学研究中,逼真且可解释的细胞模型一直备受期待。但现有的单细胞 AI 建模多依赖于深度神经网络等“黑盒”方法,难以解开高维组学数据背后的生物学因果机制。近日,微软亚洲研究院(上海)与同济大学合作在 《自然-通讯》(Nature Communications)杂志上发表了最新成果 CausCell。这一框架首次将结构因果模型与扩散模型深度融合,实现了细胞尺度的因果解耦表征与可控的反事实…
OPA-DPO:多模态大模型幻觉难题的高效解决方案
编者按:在视觉多模态大语言模型的快速发展中,幻觉问题一直是研究者们关注的焦点。模型生成与输入图像不一致甚至虚假的内容,不仅影响用户体验,也阻碍了多模态技术在实际场景中的落地。对此,微软亚洲研究院和香港中文大学的联合研究团队从直接偏好优化(DPO)入手,提出了 On-Policy Alignment (OPA)-DPO 算法,可通过确保训练数据与初始策略(reference policy)的一致性,…
Metasurface: Unlocking the future of wireless sensing and communication
| Lili Qiu and Hao Pan
Metasurfaces explore engineered 2D materials that manipulate electromagnetic and mechanical waves, offering advances in wireless tech. They can power indoor GPS, extend 5G/6G coverage, and enable wireless sensing and imaging.
创新智能表面,解锁无线通信与无线感知的未来
编者按:无线通信与无线感知技术正在悄然改变着人类认知和联系世界的方式,让我们的生活更智能、更便捷。从智能设备的无缝连接到智能家居的便捷管理,从自动驾驶的精准导航到智慧医疗的实时监测,无线技术应用的重要性如今愈发凸显。微软亚洲研究院(上海)的研究员们发挥奇思妙想,在无线通信与无线感知研究领域中不断探索、创新,通过将超表面技术与 GNSS、毫米波、微波炉加热、音频传播的研究相结合,为解决现实问题提供了…
Research Focus: Week of December 2, 2024
Can a new SOS-RMT protocol enable more efficient CL-MPC?; A fair-by-design, cloud-based algorithmic trading platform; LLM2CLIP unlocks richer visual representation; New technique enhances Low-Rank Adaptation’s expressiveness, generalization capabilities.