a tall building lit up at night

微软亚洲研究院

当工业知识遇上PIKE-RAG:昕诺飞客服效率跃升背后的技术突破

已发布

编者按:RAG(检索增强生成)技术通过为 AI 配备“外挂知识库”,有效缓解了大模型的私域知识欠缺和幻觉问题,使其更适合需要专业知识和实时数据支撑的业务场景。微软亚洲研究院开发的多功能、可扩展的 PIKE-RAG,则进一步提升了大模型在复杂工业场景中的推理和应用能力。

基于这一技术,全球照明领导者昕诺飞(Signify,原飞利浦照明)与微软亚洲研究院合作,在其知识管理系统中进行了 PIKE-RAG 概念验证(POC)测试,显著提升了客服效率和回答准确率。这一成果验证了 PIKE-RAG 在工业知识管理中的价值,也为医疗、法律、制造业等专业领域提供了可复用的技术框架——让人工智能不止于“检索”,更能像行业专家一样进行“推理”并解决问题。


作为全球领先的智能互联 LED 产品、照明系统和服务提供商,昕诺飞(Signify,原飞利浦照明)服务的对象不仅包括普通消费者,更涵盖大量对技术参数与工程适配有严苛要求的专业用户。然而,面对数千个产品型号、复杂的器件参数及多版本的技术资料,如何高效、准确地为客户提供专业解答成为了昕诺飞知识管理方面的核心挑战。

为破解这一难题,昕诺飞与微软亚洲研究院合作,利用PIKE-RAG 技术展开了概念验证(POC),并将其集成到了基于微软 Azure 云平台构建的升级版知识管理系统中。这一改进使知识库管理系统的回答准确率提升了12%。

RAG落地照明领域的挑战

在智能化快速发展的今天,高效、精准的知识管理已成为企业核心竞争力的重要组成部分。昕诺飞敏锐地洞察到这一趋势,率先在其知识管理系统中引入人工智能大模型与 RAG(检索增强生成)系统,以期更好地满足复杂多样的客户需求。

然而,传统 RAG 系统在面向专业用户的照明场景中面临一些挑战:一方面,产品知识体系高度复杂,涵盖多模态文档、非结构化表格及错综复杂的产品参数,多样化数据需要系统持续进行定制化开发,导致系统迭代周期较长,扩展性受限;另一方面,尽管通过关键词规则优化、提示词调整等方式不断优化,但仍希望利用最前沿的方法和框架进一步提高系统准确率。

为进一步释放知识管理的价值,昕诺飞开始探索更适配专业场景的技术方案。在了解到微软亚洲研究院的 PIKE-RAG 已在医疗、法律等领域的知识管理系统中成功应用并显著提升信息准确性后,昕诺飞与微软亚洲研究院展开了合作,依托微软 Azure 云平台,对 PIKE-RAG 技术进行了概念验证(POC),以提升其知识管理系统的准确率。

icon

PIKE-RAG 如何破解昕诺飞的知识管理痛点

与传统 RAG 相比,PIKE-RAG 不仅能高效检索文本信息,还能理解图表、表格等多模态内容。其内置的领域适配模块可快速学习行业特有的“思维模式”,生成更符合工程语境的专业回答。这些差异化优势主要在于 PIKE-RAG 对专业知识的特殊理解与处理方式。在昕诺飞的应用场景中,这种差异主要体现在三个方面:

多模态文档深度解析,学习行业特有的“思维模式”

昕诺飞的产品文档类型复杂多样,包括非标准化表格(如不同电流下的电压范围对照表)、电路接线图(标注驱动器的功率限制)等内容。传统系统往往无法有效处理这类信息——要么直接忽略,要么仅提取出混乱的文本片段。

PIKE-RAG 融合了微软亚洲研究院文档智能(document intelligence)技术和微软 Azure OpenAI (国际版)模型,能够精准识别表格结构、解析电路图中的关键参数。例如,当客服查询”某型号驱动器在0.15安电流下的输出电压”时,系统能自动定位文档中的曲线图,并根据电流区间推算出40-54伏的准确范围,而这正是传统系统因无法“读图”而频繁出错的场景之一。

端到端知识闭环,摆脱对错误数据源的依赖

在实际应用中,企业知识库管理系统往往需要整合多种信息源的数据,偶尔会出现“不同来源内容存在差异”的情况,尤其当数据库更新节奏未能完全同步时。PIKE-RAG 则能捕捉多样化的信息源,将其作为源节点建立引用关系,为依赖多源信息的复杂推理任务提供支撑。

换言之,PIKE-RAG 可以直接以原始文档为数据源,无论是产品说明书还是 PDF 图表都能被高效解析和理解。通过从这些包含文字与图形的复杂文档中提取关键信息,PIKE-RAG 实现了更高效、可信的知识检索。

动态任务分解与多跳推理,复杂问题也能得到精准答案

传统 RAG 多为“一问一答”的生成模式,难以应对需要多步推理的复杂问题。而昕诺飞所在的照明领域,客户问题往往存在多级关联。对此,PIKE-RAG 能够将用户提问动态分解为多个可执行的子任务,并通过“多跳推理”逐步求解。例如,当客户提问“列出与 G8 系列灯具匹配的全部底座”,但所有文档中均未直接说明 G8 的适配底座时,PIKE-RAG 的推理过程如下:

  • 第一步:系统发现一条隐含知识——某文档指出 G7 与 G8 尺寸完全一致,并声明所有适用于 G7 的底座均可兼容 G8。
  • 第二步:基于该线索,系统转而检索 G7 系列对应的底座列表。
  • 第三步:由于该列表仅以缩写形式罗列底座型号,系统会进一步在文档中查找缩写与全称的对照表,最终生成 G8 底座的完整型号列表。

通过这一系列自动化的多跳推理,系统最终为客户提供准确、完整的答案。

diagram
图1:PIKE-RAG 在多源和多模态数据环境中有效编排和整合异构信息

经测试,基于 PIKE-RAG 的知识管理平台展现出显著优势:相比原有系统,基于 PIKE-RAG 的系统性能提升了12%。值得注意的是,这些成绩均是在没有针对单个问题进行任何定制化调整的情况下取得的,仅通过算法优化就实现了知识的精准匹配与生成。这意味着,随着系统不断学习和吸收昕诺飞的专有知识,回答准确率还将进一步提升。

“在‘产品规格洞察工具’的概念验证中,PIKE-RAG 帮助我们显著提升了原有系统性能,这将进一步提升客户服务的整体满意度。目前,我们正从技术落地、成本控制及未来适配性等多维度评估 PIKE-RAG 的应用路径,也期待与微软亚洲研究院深化合作,共同推动相关技术的迭代发展。”昕诺飞中国研究院院长刘海涛表示,“更值得一提的是,在合作过程中,微软亚洲研究院的研究员们展现了深厚的行业知识和严谨的科研态度。面对照明产品等跨领域的新兴知识,他们积极主动学习、深入分析,追溯并厘清问题的根本原因,使 PIKE-RAG 更加契合昕诺飞的实际应用需求。”

从照明到多元场景,PIKE-RAG展现强大泛化能力

在昕诺飞的成功测试中,PIKE-RAG 展现出了在复杂工业场景中的强大泛化能力,可实现跨领域的快速适配,其三大核心优势为:

支持系统自我进化与持续学习。PIKE-RAG 能够持续分析交互日志中的错误案例,利用进化算法自动优化知识抽取策略(如尝试不同表格解析方法、调整多模态内容权重),并将验证有效的策略固化应用于未来的问答中,无需人工干预即可适应新知识类型。

以能力需求为导向的模块化架构。PIKE-RAG 可以灵活组合文件解析、知识提取、知识存储、知识检索、知识组织、以知识为中心的推理、任务分解与协调等子模块,针对不同场景需求(如事实检索、多跳推理、创新生成)动态调整能力重心,灵活构建适应实际场景的 RAG 方法,高效处理各类复杂任务。

深度适配领域专属思维模式。通过 Domain Tips(领域提示)动态更新功能,企业可实时加入特定领域的逻辑规则(如 LED 驱动器的“最大输出电压应取工作电压范围的最大值而非参数表里面的最大输出电压”),让系统能像专业工程师一样,遵循行业约定俗成的思维方式。

图2:PIKE-RAG 框架全景图
图2:PIKE-RAG 框架全景图

PIKE-RAG 的这种泛化能力在昕诺飞知识管理平台中得到验证的同时,也在工业制造、采矿、制药等多个领域的测试应用中,显著提升了问答系统的准确度。

“昕诺飞作为照明领域的领导者,其复杂的工业知识体系为 PIKE-RAG 技术提供了极具挑战性的落地场景。通过这次合作,我们不仅验证了 PIKE-RAG 的通用方法能大幅提升专业知识问答的准确率,加速场景定制周期,更积累了研究员们处理领域特有数据的经验。”微软亚洲研究院全球研究合伙人边江强调,“我们的目标不是打造全能的通用聊天机器人,而是构建能够深度理解专业领域思维、具备严谨知识推理能力的专业助手。这才是工业知识管理智能化转型的核心驱动力。”

继续阅读

查看所有博客文章