Saltear al contenido principal
Translator
Esta página ha sido traducida automáticamente por el servicio de traducción automática de Microsoft Translator. Aprende más

Microsoft Translator blog

Transcripción, traducción y síntesis de voz personalizables ahora disponibles en el servicio de voz unificado

Integre el discurso en sus aplicaciones, flujos de trabajo y sitios web usando el servicio de voz unificado, anunciado esta semana en Microsoft Build. El discurso combina las capacidades de la API de voz del traductor existente, la API de voz de Bing y el servicio de voz personalizado (previsualización) en un servicio unificado y totalmente personalizable.

Ahora puede utilizar el discurso al texto, la traducción de voz y el texto a los servicios de voz con la misma suscripción. Los tres servicios se pueden personalizar utilizando la vista previa de la nuevo discurso personalizado, traductor y funciones de voz, también anunció esta semana en//Build:

  • Voz a texto (transcripción de voz) – conversión de audio hablado al texto con modelos predeterminados o personalizados adaptados a vocabulario específico o estilos de conversación de los usuarios (personalización del modelo de idioma), o para ajustar mejor el entorno esperado, como con el fondo ruido (personalización acústica del modelo). La tecnología de discurso a texto permite una amplia gama de casos de uso como comandos de voz, transcripciones en tiempo real y análisis de registro del centro de llamadas.
  • Texto a voz (síntesis de voz) – trayendo voz a cualquier aplicación mediante la conversión de texto a audio en casi tiempo real con la opción de más de 75 voces por defecto, o con los nuevos modelos personalizados de voz, la creación de una marca única y reconocible voz sintonizada con sus propias grabaciones.
  • Traducción de voz – proporcionando capacidades de traducción de voz en tiempo real con modelos basados en tecnologías neuronales de traducción automática (NMT). Ahora se pueden personalizar tres elementos del canal de traducción de voz: reconocimiento de voz, texto a voz y traducción automática.

Traducciones neuronales con la versión más reciente de la API de texto del traductor (versión 3), también puede utilizar los sistemas personalizados construidos con la función Custom de nuevo traductor.

El servicio de voz unificada se ofrece actualmente como una vista previa. Para la traducción de voz que requiere un servicio en la disponibilidad general, los desarrolladores deben continuar utilizando la API de voz de Microsoft Translator. Por favor, siga el traductor de Microsoft Blog Y Twitter Página para continuar, hasta la fecha anuncios de servicio de Microsoft Translator.

Obtenga más información sobre el Blog de servicios cognitivos.

 

Aprende más

Traducción de voz de Microsoft Translator