Reconocimiento de voz y texto: una necesidad socialLos adelantos en estas tecnologías permiten a día de hoy la comunicación con el ordenador multimedia sin la necesidad del teclado y pantalla. Algunas personas discapacitadas pueden utilizar el PC para trabajar y comunicarse. Santiago Garate Martínez. Socio DirectorAssit. |
Las diferentes aplicaciones de esta tecnología han pasado por su desarrollo y utilización en los ámbitos de la defensa nacional y la seguridad del estado. Actualmente se siguen utilizando en éstos y otros mercados que han permitido desarrollar nuevos negocios. En este artículo puede conocer la evolución desde sus inicios al día de hoy con las diferentes empresas implicadas en su investigación y desarrollo. |
Los discapacitados son personas que precisan de las Nueva Tecnologías para poder llevar a cabo su vida y, sobre todo, de la manera más cómoda posible. Por esta razón, algunas entidades privadas y fundaciones han puesto a su disposición una serie de productos basados en el reconocimiento de voz como medio para cerrar una puerta, una ventana o encender la televisión. Sicare LightLas personas que padecen una discapacidad que limita su movilidad deben mantener la mayor independencia y autonomía personal. Ciertas acciones cotidianas y habituales, como el funcionamiento de una cama hospitalaria, el teléfono, la luz o el sistema de aviso a la enfermera deberían ser realizados sin la necesidad de ayuda externa. • Sicare light es un pequeño y completo mando de control con reconocimiento de voz para personas con discapacidad física. • Funciona fácilmente con la voz y permite controlar los aparatos que estén provistos de receptor por infrarrojos, como por ejemplo: ventanas, puertas, televisiones, equipos de música y muchos más, usando simplemente su voz. • Después de una corta y simple fase de entrenamiento, el Sicare light podrá entender cualquier idioma. • Control total, por ejemplo, de ventanas, puertas, sistemas de aviso de enfermería, camas eléctricas, teléfonos, televisiones, videos, equipos de música, persianas, luces, calefacciones, aire acondicionado, ventiladores, electrodomésticos (siempre y cuando tengan incorporados receptores de infrarrojos). Inicios A finales de los 80, se utilizaron sistemas locales "para introducir información en un PC" a través de un sintetizador de voz. La tecnología disponible tenía sus limitaciones y las primeras aplicaciones comerciales salieron al mercado como pilotos para desarrolladores. Era un producto de I+D donde las principales empresas en USA colaborando con las distintas universidades consiguieron sacar al mercado sistemas con un grado de aceptación bueno. El dictáfono Tuvo éxito por la necesidad que existía en el mercado. La dificultad de reconocimiento al dictado era importante y se consiguió cierta calidad, aunque no cubría las expectativas generadas. Los sistemas permitían reconocer números y palabras aisladas con suficiente eficiencia. Un ejemplo fue el dictáfono de Philips (Aagen -Alemania) que tuvo una implantación importante. Evolución de la ofertaEn los años 1984/85. El Centro de Investigación y Estudios (C.I.E) de Telefónica, trabajaba conjuntamente con Texas Instruments para sacar un producto español al mercado. De esta experiencia fue el proyecto Audiotex de Telefónica Sistemas IBM fue uno de los pioneros en importar esta tecnología de USA ofreciendo al mercado una solución evolucionada en castellano. Dragon (Newton –Massachusets), sacó al mercado un sistema de reconocimiento bastante perfeccionado. Posteriormente ya en los años 1990/91 Telefónica continúa desarrollando un producto propio en colaboración con Bell Labs (U.S.A). investigación y desarrollo de Carnegie Mellon en Pittsburg (USA), Microsoft con el sistema Esfinge. La investigación y desarrollo de Carnegie Mellon en Pittsburg (USA), Microsoft con el sistema Esfinge. En España iniciaron la incorporación contestadores digitales,"Guías Vocales" para centralitas y posteriormente los sistemas de "Voice Mail” o correo de voz para empresas. Oportunidad de Negocio.La demanda y necesidad de los Centros de Atención de Llamadas (Call Center) con una batería de puestos de operadoras para operaciones de información (1003 de Telefónica) o comerciales en banca y finanzas, impulsa el desarrollo del mercado de los sistemas de reconocimiento de voz: DataPoint (USA), Concentronics (grupo Banesto), DataVoice (España) son un claro ejemplo de la implantación de la tecnología USA en España en los 90. Aparecen los sistemas de grabación digitalizados y el acceso por líneas digitales a los ordenadores Centrales (HOST) permite el diálogo interactivo de los sistemas de reconocimiento de voz centralizados y con acceso por en red digital. Los primeros sistemas con lenguaje natural se implantan en los portales de voz de móviles. Mayor avance se ha conseguido en los sistemas de reconocimiento de texto-voz donde hay producto perfeccionado y disponible en el mercado. Situación actual.En el mercado se han creado falsas expectativas que la tecnología disponible no puede satisfacer. A medida que se desarrolle la demanda y genere recursos para I+D, podrán irse perfeccionando los sistemas. En USA, que las inversiones en I+D son mayores que en Europa, siguen desarrollando y perfeccionando los sistemas: Nuace: California (U.S.A), Scansoft, Speachword. Elan Informatic. Tecnología disponible: Actualmente el hardware es un PC estándar con dos procesadores (Pentium blade) de propósito general y de libre distribución. No es práctico implementar los algoritmos directamente en el silicio. La velocidad de proceso es importante al tener que actualizar millones de nodos cada segundo. No ocurre así con el software donde cada fabricante tiene sus propios programas y herramientas de desarrollo que “desarrollan la aplicación a medida del cliente”, habitualmente en lenguajes “asambler” o lenguaje máquina. Las rutinas están muy optimizadas y es difícil reducir el proceso para mejorar la velocidad de reconocimiento. Una de las medidas de la eficiencia del reconocedor es la “Tasa aciertos” que al día de hoy es mejorable. |