新闻与深度文章
编者按:随着多模态和推理模型的快速发展,能够自主理解并操作计算机界面的智能体(Computer Use Agent, CUA)正逐渐成为现实。其中,图形界面定位(GUI Grounding)是实现这一能力的核心环节,它决定了智能体能否准确地完成点击、输入等具体操作。然而,现有模型在关键基准测试中的准确率仍较低,距离实际应用尚有差距。对此,微软亚洲研究院近期发布了技术报告系统分析了 GUI Grou…
编者按:RAG(检索增强生成)技术通过为 AI 配备“外挂知识库”,有效缓解了大模型的私域知识欠缺和幻觉问题,使其更适合需要专业知识和实时数据支撑的业务场景。微软亚洲研究院开发的多功能、可扩展的 PIKE-RAG,则进一步提升了大模型在复杂工业场景中的推理和应用能力。 基于这一技术,全球照明领导者昕诺飞(Signify,原飞利浦照明)与微软亚洲研究院合作,在其知识管理系统中进行了 PIKE-RAG…
编者按:当大模型已能“写对”内容,如何让文档也“好看、易读”成为办公智能体转型的新焦点。微软亚洲研究院携手香港中文大学、中国科学院大学提出了一个专注于评估文档“结构与样式”专业性的奖励模型 DocReward。该模型为智能体生成的文档提供了清晰、可量化的优化信号,使其不仅在内容层面准确可信,更在形式呈现上清晰有序、专业规范,为下一代智能办公智能体的落地奠定了关键基础。 近年来,随着智能体化转型(A…
编者按:随着大语言模型(LLMs)推理能力的不断提升,如何在训练过程中保持稳定的优化效率与可验证性,成为强化学习研究的重要方向。由微软亚洲研究院与清华大学联合提出的 VL Norm 方法,针对可验证奖励强化学习(RLVR)中因输出长度波动导致的梯度方差过大问题,给出了理论上无偏且方差最小的解决方案。在多种任务和模型规模上,VL Norm 均显著提升了收敛速度与训练稳定性,展现出了强化学习优化的新范…
编者按:当大模型的规模不断突破极限,AI 训练的算力需求也在以指数级攀升。传统 GPU 已难以兼顾性能与能效,异构 AI 芯片逐渐成为新趋势。但如何让不同计算单元“协同作战”,仍是编译领域的一大难题。北京大学、微软亚洲研究院、帝国理工学院与上海交通大学联合团队研发的 PipeThreader 系统,旨在解决这一核心挑战。PipeThreader 首次提出“流水线导向编译”理念,让编译器能够像“流水…
编者按:量化投资正迎来由人工走向智能的深刻变革。随着大语言模型(LLMs)与多智能体系统在金融研究中的快速发展,如何让 AI 真正融入量化投研流程、实现从假设生成到策略回测的全链路自动化,成为学术界与产业界共同关注的前沿问题。 继开源通用自动化研发框架 R&D-Agent 之后,微软亚洲研究院进一步推出面向量化金融领域的专项版本 R&D-Agent-Quant(R&D-Ag…
编者按:当“理性”的科学发现与“情感丰富”的科研人员相遇,会发生怎样的化学反应? 在人工智能与神经科学的交汇处,微软亚洲研究院高级研究员王延森,正怀揣着浓厚的兴趣,聚焦人的需求与体验,展开一场关于智能本质的探索。他以非侵入式脑机接口为钥匙,试图破解人类感知与意图的神经密码;以脉冲神经网络为桥梁,探索人脑低能耗运行的奥秘;秉持“以人为本”的初心,让技术回归服务于人的本质。跟随王延森的脚步,我们将见证…
近日,香港科技大学举行了隆重的颁授典礼,向六位在学术界、产业界以及社会发展做出卓越贡献的杰出人士颁授荣誉大学院士称号。微软亚洲研究院院长周礼栋博士荣获此项殊荣并受到表彰。 颁授典礼由香港科技大学校董会主席沈向洋教授及香港科技大学校长叶玉如教授共同主持。沈向洋教授在致辞中高度赞扬了获奖者在推动知识进步、服务社会和启发后人等方面所展现的杰出领导力与深远影响。 作为微软亚洲研究院的掌舵人,周礼栋博士长期…
编者按:在数学、编程等高度挑战的推理任务中,大语言模型正在展现前所未有的突破。然而,支撑其背后的传统训练范式仍存在效率低下与“灾难性遗忘”的困境。为此,微软亚洲研究院与香港中文大学联合提出了 BRIDGE 框架,通过双层优化机制让监督微调(SFT)与强化学习(RL)“携手并进”,突破了长期以来的两阶段训练瓶颈。BRIDGE 不仅在多个权威测试中实现了显著的性能提升,还为未来大模型后训练开辟了新方向…