Una gran parte de la información almacenada digitalmente son
datos de texto no estructurados, tanto en archivos de texto simples
como en documentos formateados. La mayoría de estos datos de texto
se almacena en sistemas de archivo, pero son muchas las empresas que
están comenzando a almacenar esta información en bases de datos
relacionales. De esta forma se obtienen las ventajas de una base de
datos, lo que incluye un acceso de alto rendimiento, la capacidad de
consulta, interfaces de usuario basadas en aplicaciones sencillas
para usuarios finales, y acceso remoto seguro. La Búsqueda de texto
completo permite a los desarrolladores proporcionar el acceso a
datos estructurados o no de manera uniforme desde sus aplicaciones.
Gracias a este tipo de Búsqueda, los usuarios finales pueden
buscar en textos almacenados en bases de datos incluso si el texto
está contenido en un documento formateado, permitiendo:
-
Las consultas de texto completo en datos de texto almacenados
en tablas relacionales.
-
Las consultas de texto completo que se integran totalmente en
el lenguaje T-SQL; las consultas únicas pueden combinar paradigmas
de búsqueda de texto completo y tradicionales.
-
La búsqueda en columnas indexadas de texto completo de una
tabla.
-
El acceso programático a la información de la consulta
(relative rank of hits, weighting by search terms, etc.).
-
Returning the top n matches by rank, useful for enhancing
performance.
-
Consultas de texto completo en documentos formateados (como
documentos de Office y de HTML) almacenados en columnas BLOB de la
base de datos y registrados para la indexación de texto completo.
SQL Server 2000 viene con filtros para archivos de HTML, archivos
de texto, y documentos de Office, y los desarrolladores pueden
escribir sus propios filtros mediante la especificación IFilter.
SQL Server 2000 también presenta el seguimiento de cambios de
todos los índices de texto completo para reducir la necesidad de
poblaciones completas y crecientes.