Healthcare: Digital Doctor

Established: December 1, 2015

Goal: Digital Doctor is a doctor assistant bot, which can help doctor to improve self ability and also answer patients questions automatically

Demo:

  • Auto QnA: http://msraml.cloudapp.net/home/manage.html
  • Medical KB: http://msraml-s004:2521/

3  picture2

4

Techniques

KB Construction

  • 知识字典建立
    • 问题: 对疾病,症状,药品,检查,治疗,医院,科室等名词建立字典
    • 难点:信息抽取与结构化,同一名词不同说法的学习(专用语,通用语)
    • 对应技术:
      • Kable: 信息抽取与结构化
      • Enterprise Dict APIs
      • 可借用技术:Translation
  • 关系知识图谱建立
    • 问题:建立疾病,症状,用药,检查,治疗,科室,医院的关系知识图谱
    • 难点:显式与隐式关系抽取与学习
    • 对应技术:
      • 显式:Kable + RNN/CRF
      • 隐式 : Conceptualization + DNN
      • E.g. 药品冲突,易混淆疾病
  • 知识文档索引
    • 问题:将医学文档信息,如临床指南,个人问答数据分类到知识图谱对应位置建立索引
    • 难点:文本语句,段落,章节分割索引
    • 对应技术
      • Kable – QA Mining (Explicit + Implicit)
      • 可借用技术:Malta, Doc chat

KB Calculation

  • 长文本问题理解
    • 问题: 因医疗问题较长,长文本问题的意图与上下文理解作为输入层第一步
    • 难点:问题意图ontology, schema建立,在线意图识别
    • 对应技术:
      • 问题意图识别(NER, Semantic Clustering etc., knowledge based text classification)
      • 可借用技术:LUIS (需中文),Entity Linking
  • 交互式问题理解
    • 问题:很多医疗问题需多轮交互且医生主导,如何建立多轮交互了解用户意图
    • 难点:基于知识图的有条件知识学习数据来源
    • 对应技术:
      • Conditional Knowledge Learning (CIKM16)
      • 可借用技术:conversation bot
  • 信息检索
    • 问题:理解用户意图与上下文后,结合知识图谱的推理与文本索引寻找答案
    • 难点:知识图谱索引推理与文本检索的混合检索模型
    • 对应技术
      • 子图定位,语义检索,混合排序、

Application

  • 主动知识学习的交互
    • 问题: 作为知识库学习的一部分,如何通过大数据分析主动向人类专家提问,并补充进知识库
    • 难点:问题筛选与生成
    • 对应技术:
      • 文本聚类,排序(Kable2.0 范畴)
  • 被动服务中与用户的交互
    • 问题:如何看懂用户需求并返回用户看得懂的答案,可能需要多轮交互
    • 难点:专业术语对通俗语言的翻译
    • 对应技术:
      • Metaphor Learning
    • 可借用技术:
      • Personality
      • QnA
  • 服务交互中的主动推荐
    • 问题:如何根据用户输入及上下文信息,基于知识库给出合理健康建议及不合理行为提醒
    • 难点:基于上下文和知识库的推荐
    • 对应技术
      • Context aware recommendation engine