嘉讯广源利用微软最新混合现实和人工智能科技 创造颠覆式可交互场景,让生活更加美好

“微软最新的人工智能和混合现实技术,不仅让我们看到了未来的科技体验,更是一种可以轻松应用到当前业务场景中的可靠技术组合。我们解决方案所使用的微软 HoloLens 的全息影像和体感交互和微软认知服务强大的语音识别和机器学习,都给客户留下了深刻印象。”

———李科研,总裁,北京嘉讯广源科技有限公司

 

业务背景

时至今日,随着互联网+、工业 4.0 等新的技术趋势的快速兴起,一次全新的科技变革——数字化转型,正在给世界各地、各行各业的人们带来新一轮的发展机遇。也在为我们每个人打造更便捷、更健康、更美好的智能生活。

而人类智慧的伟大之处,就在于我们能够通过发明、创造技术与工具,获得超越自然属性的能力。混合现实、人工智能,作为互联网时代向智能时代转变过程中的重要出发点,可以让每个人都从中受益。正是在这样的背景下,无论是企业、院校,还是政府和公共服务机构,都希望通过应用最新科技深入探索业务潜力,改善服务质量,把握向人工智能时代转型的机遇,实现跨越式增长,开启未来

在嘉讯广源所服务的客户群体中,越来越多的客户希望使用混合现实技术实现虚拟教学、虚拟营销等场景,为用户提供更加自然、人性化的可交互体验。同时,近几年出现的语音助手、聊天机器人等技术也不断吸引着商业客户的关注,许多客户部署了云计算和大数据解决方案后,希望更进一步的发挥云计算和大数据的优势,通过自然语言交互、体感操作等方式彻底改变现在的繁琐的业务场景和流程,提供更加智能化的业务交互体验。

面对客户需求,嘉讯广源面临的挑战在于,如何将实践中所积累的客户经验,通过一套实用性的新技术,以可靠稳定的企业级商业解决方案的方式呈现出来。面对不同客户在不同行业、领域和应用场景中的需求,嘉讯广源关注于解决方案的易用性和敏捷性,并能与现有基础架构,包括云平台、数据库和企业信息系统及服务实现完美配合。

经过对不同领域的多个客户调研,嘉讯广源希望找到一套能够彼此协同的智能化技术,提供一个涵盖了端到服务的解决方案,以一种无缝的智能可交互环境,让最终用户能够轻松应用于不同业务需求。

解决方案

经过对不同厂商的多种技术进行对比和评估,嘉讯广源最终决定使用微软全套技术栈作为其企业级智能可交互场景方案的实施基础。嘉讯广源将多种微软最先进的人工智能技术和混合现实技术转化为每个人触手可及的工具、平台和服务,可以服务于智能家居、汽车销售、互动式教学和市政公共服务等多种场景。这一解决方案的核心组成包括:

微软 HoloLens 混合现实技术

在 HoloLens Dev Kit 发布之后,嘉讯广源很快利用 HoloLens Mixed Reality 特性和 HoloLens 全新用户交互方式开发出针对教育和培训、展厅展馆、汽车虚拟展销应用和解决方案。该方案针对特定的行业场景,提供了逼真的全息影像 3D 模型(Hologram),同时,用户还可以通过手势(Gesture),注视(Gaze)等体感操作实现与演示模型的自然交互。

微软认知服务

微软认知服务是一个完全开放的自定义的智能语言理解服务。开发者可以根据自己的场景,定义相关意图,进行快速机器学习训练。嘉讯广源将微软认知服务与 HoloLens 相结合,提供了完整的可交互混合现实场景体验,该方案的架构图如下:

经过调研和评测,嘉讯广源发现目前大部分的 OpenAPI 服务只支持中文的语音识别,而只有微软的认知服务能做到精准的语音识别和拟真的语音合成。同时,微软认知服务还提供定制化的中文自然语言理解服务,结合深度学习技术,嘉讯广源的解决方案可以根据用户的表达进行行为预测,准确返回用户意图,充分满足不同场景下 HoloLens 里的中文语音+语义的识别需求。

微软 UWP 应用程序平台

微软 UWP 应用平台又成为通用 Windows 应用平台,是从 Windows 10 引入的可适用于多种设备(PC、平板和手机)的应用程序框架,同时,使用 UWP 开发的应用程序还可以运行在混合现实设备 HoloLens 和物联网 IoT 设备上,实现了跨平台、具有一致 用户体验的特性。嘉讯广源利用微软 UWP 技术开发的可交互业务场景应用不仅支持 HoloLens 设备,还可以针对用户需求,在 PC 或移动设备上运行。

企业收益

利用微软最新人工智能和混合现实技术的嘉讯广源,极大的增强了客户已有的能力,帮助客户获得更强生产力的同时,以颠覆 式的可交互场景,让人们的生活更加美好。

项目展示图

这一方案的推出为嘉讯广源的客户提供了多方面的收益:

利用人工智能实现更复杂的业务需求

在自然语言驱动的可交互人机场景中,中文语音命令识别的准确性和响应速度是影响用户体验的核心考量点,微软认知服务的语音识别 API 针对长句和中英文混合语句具有精准的语音识别能力和上下文相关的自然语意理解能力。不论用户如何表达,都可以精准识别用户的意图,快速形成文本或操作指令。结合认知服务的深度学习等技术,还可以进一步对用户行为进行预测和分析,实现更为复杂的业务场景。微软认知服务基于 REST API 提供,可以方便地集成在各种平台,支持各种开发语言的调用和开发。

交付触手可及的未来体验

嘉讯广源除了在教学和培训解决方案中应用 HoloLens,还开发定制了适用于该解决方案的智能数字助理,该助理可以随着不同 3D 全息影像,对场景变化进行实时介绍和讲解。同时,还可以和用户进行自然中文语音对话,了解使用者的意图。让场景教学被智能化的可交互助手替代,同时使整个交互体验更加直观、方便。

满足客户差异化和多样化需求

嘉讯广源已经为更多场景需求做好了准备,微软领先的人工智能技术不仅帮助他们保持了高水准的竞争力,还可以通过丰富的技术组合满足客户的不同要求。针对每一位客户,定制化打造切实贴合客户需要的应用场景,将交互体验达到最优状态,满足客户在场景差异化和多样化方面的需求。

客户

  • 北京嘉讯广源科技有限公司

数字化转型领域

解决方案领域

行业

查看全部案例 >>

推荐案例

Top