Abstract

基于文档级别的排序和检索是信息检索领域几十年来的传统模式,目前大多数搜索引擎也采 用了这种模式而把网页作为信息的基本单元。但是在网页和互联网数据库中存在着大量的关 于真实世界中对象的结构化信息。在某些领域中,对象是一种更为有效的信息表述单元。目 前我们正在探索一种新的模式,以实现特定领域中对象级别的互联网搜索,从而更好地满足 用户的信息需求。这种对象级别的搜索模式由一系列相关技术构成,包括对象信息的发现和 分类、对象抽取、对象继承、对象排序和检索等。在本文中,我们介绍对象级搜索引擎的系 统体系结构和核心技术,以及两个具体的对象级搜索引擎:Libra 学术搜索和 Windows Live 商品搜索。