News & features
In recent years, as the shift toward agentic AI has accelerated, automation has advanced to handle increasingly complex tasks, from document and code generation to image creation, visual understanding, and mathematical reasoning. This trend points to the growing need to…
DocReward:让智能体“写得更专业”的文档奖励模型
编者按:当大模型已能“写对”内容,如何让文档也“好看、易读”成为办公智能体转型的新焦点。微软亚洲研究院携手香港中文大学、中国科学院大学提出了一个专注于评估文档“结构与样式”专业性的奖励模型 DocReward。该模型为智能体生成的文档提供了清晰、可量化的优化信号,使其不仅在内容层面准确可信,更在形式呈现上清晰有序、专业规范,为下一代智能办公智能体的落地奠定了关键基础。 近年来,随着智能体化转型(A…
VibeVoice实现90分钟、多角色播客生成,拓展语音合成新边界
编者按:AI 自动生成播客早已不是新鲜事,但常见的 AI 播客只局限于几分钟的双人对话,这是因为传统语音生成模型大多基于离散化方法,更擅长生成短句、单一音色、结构规整的语音内容。近日,微软亚洲研究院提出了一种全新的语音生成模型 VibeVoice。该模型采用 next-token diffusion 机制,实现了长达90分钟、支持最多4人自然对话的高质量语音生成。更重要的是,VibeVoice 生…
CoR:多范式思维加持,大模型也能学会“多思路解题”
编者按:大语言模型(LLMs)在语言生成与基础推理中已展现出强大的能力,但它们在数学解题上的能力仍存在明显短板,尤其是难以兼顾复杂计算与定理证明。这背后的关键原因在于,现有模型普遍依赖于单一的推理范式(如自然语言、代码或符号推理),缺乏人类思考问题时那种灵活的推理能力。 为此,微软亚洲研究院与清华大学联合提出了“推理链”(Chain-of-Reasoning, CoR)框架,引入了自然语言、代码与…
One of the driving forces behind AI’s rapid progress is access to large-scale, high-quality data, essential to enable training models to continuously improve and perform reliably. But that well is running dry. As the supply of usable internet data shrinks,…
World models are a key concept in AI, used to simulate how agents behave in virtual environments and enable immersive, interactive experiences. They’re not only transforming game and media generation, they’re also opening new frontiers for using AI in complex,…
SYNTHLLM框架:突破人工智能“数据墙”瓶颈,为AI训练注入新动力
编者按:数据是人工智能发展的“动力燃油”,但如今其正面临“枯竭”的风险,这道“数据墙”成为制约大模型性能突破的关键瓶颈。在此背景下,合成数据技术应运而生。近期,微软亚洲研究院推出了一个可扩展的 SYNTHLLM 框架,能够生成多样化的合成数据,有效填补自然数据的空缺。此外,研究员们还发现并证实了合成数据的规模法则,为大模型使用合成数据进行训练与优化提供了科学依据。 人工智能在当今取得如此显著发展的…
MaaG:迈向世界模型,解决生成式游戏中的数值与时空一致性难题
世界模型(world models)是人工智能领域的一个重要概念,旨在通过模拟虚拟世界中主体行为的演变,实现高度逼真的互动体验。这种模型不仅可以为游戏和互动媒体的生成带来革命性的变化,也将为人工智能在复杂环境中的应用提供新的可能性。其中,生成式游戏(generative games)作为构建世界模型的关键途径,备受关注。例如,微软提出的 MUSE 能够用神经网络生成游戏《嗜血边缘(Bleeding…
Research Focus: Week of January 22, 2024
Welcome to Research Focus, a series of blog posts that highlights notable publications, events, code/datasets, new hires and other milestones from across the research community at Microsoft. Join Microsoft Research Forum (opens in new tab) for a continuous exchange of…