新闻与深度文章

编者按:当前,大语言模型在代码生成领域已展现出惊人的能力,但能否胜任真实软件开发中的“新增功能实现”任务,仍是一个关键未解的问题。对此,微软亚洲研究院与北京大学联合发布了首个专注于仓库级新功能实现的基准测试 FEA-Bench,填补了评估体系中的重要空白。该测试集构建于真实开源项目的 pull request (合并请求),覆盖1400多个高质量任务,系统评估了主流大模型在复杂工程任务中的表现。F…

编者按:在传统的机械设计和制造流程中,参数化 CAD 文件一直是概念与制造之间的关键桥梁。然而,工程师们长期以来一直被复杂的 CAD 特征树和繁琐的建模流程所困扰。近年来,随着大语言模型(LLMs)的飞速发展,AI 在多个领域展现了其强大的能力。本文将介绍三项微软亚洲研究院的最新研究——FlexCAD、CADFusion 和 CAD-Editor。它们分别从统一建模框架、视觉反馈机制和自然语言编辑…

编者按:当人工智能遇上创意设计,一场视觉革命正悄然展开。人工智能图像生成技术为人们提供了无限的灵感源泉。然而,从实验室走向实际应用,从激发灵感到完美创作,在编辑自由度和可控性需求日益增长的当下,人工智能生成图像的技术仍然面临诸多挑战。 微软亚洲研究院的研究员们在文本生成图像领域的两项最新研究成果,为促进相关技术的实际应用开辟了新的道路——匿名区域 Transformer (Anonymous Re…

编者按:欢迎阅读“科研上新”栏目!“科研上新”汇聚了微软亚洲研究院最新的创新成果与科研动态。在这里,你可以快速浏览研究院的亮点资讯,保持对前沿领域的敏锐嗅觉。 6月10日至17日,全球计算机视觉领域的顶尖学术盛会 CVPR 在美国田纳西州纳什维尔举办。我们通过两期“科研上新”为大家带来多篇微软亚洲研究院入选 CVPR 2025 的精选论文解读。第一期分享的内容主要围绕生成模型与扩散技术等方向的研究…

编者按:在 MBTI 测试风靡的当下,人们热衷于探寻自己究竟是充满活力的“快乐小狗”,还是敏感细腻的“流泪猫猫”。当大模型逐渐成为人们生活中不可或缺的助手时,你是否会好奇:这些大模型有着怎样的特性,或者说,它们秉持何种不同的价值观? 微软亚洲研究院最新发布的 Value Compass Benchmarks(价值观罗盘评估中心),可以帮助用户以更科学、系统和可靠的方式,对大模型的价值观展开评估。同…

编者按:欢迎阅读“科研上新”栏目!“科研上新”汇聚了微软亚洲研究院最新的创新成果与科研动态。在这里,你可以快速浏览研究院的亮点资讯,保持对前沿领域的敏锐嗅觉。 6月10日至17日,全球计算机视觉领域的顶尖学术盛会 CVPR 将在美国田纳西州纳什维尔举办。我们将通过两期“科研上新”为大家带来多篇微软亚洲研究院入选 CVPR 2025 的精选论文解读。第一期的分享内容是主要围绕生成模型与扩散技术等方向…

编者按:在视觉多模态大语言模型的快速发展中,幻觉问题一直是研究者们关注的焦点。模型生成与输入图像不一致甚至虚假的内容,不仅影响用户体验,也阻碍了多模态技术在实际场景中的落地。对此,微软亚洲研究院和香港中文大学的联合研究团队从直接偏好优化(DPO)入手,提出了 On-Policy Alignment (OPA)-DPO 算法,可通过确保训练数据与初始策略(reference policy)的一致性,…

编者按:随着应用场景的扩展,端侧设备(如手机、电脑、可穿戴设备、机器人等)对大模型高效运行的需求日益增长,但端侧设备对模型运行的计算资源、访存带宽、能耗都有着极其苛刻的要求。存内计算技术有望从根本上解决以上资源问题,它能够将存储单元和计算单元融合,显著减少数据在存储和计算单元间频繁搬运而产生的资源损耗。然而,传统存内计算涉及对硬件架构的改动,不仅技术难度大,且迭代周期长,无法在实际场景中大规模量产…

编者按:在产业智能化加速发展的当下,时间序列数据已然成为智能决策系统的关键基石。然而,传统的时间序列生成模型往往难以应对跨领域、跨风格的数据需求,且生成的数据在实际应用中缺乏可控性和实用性。 为解决这些痛点,微软亚洲研究院推出开源框架 TimeCraft,融合多项研究成果,通过跨域泛化、自然语言控制与任务感知等创新技术,助力时间序列生成任务从结构理解到任务对齐的全流程能力建设。TimeCraft…