2018.10.01. - 2018
Ezt az oldalt a Microsoft Translator gépi fordítószolgáltatása automatikusan lefordította. Tudjon meg többet

Mikroszkóp fordító blog

Mikroszkóp fordító hoz vég--hoz-vég beszéd fordítás-hoz mindenki-val a világ ' első beszéd fordítás API

Ma kiadtunk egy új változatát Microsoft fordító API amit összead valóságos-idő beszéd--hoz-beszéd (és beszéd-hoz szöveg) fordítás képességek-hoz létező szöveg fordítás API. Powered by Microsoft korszerű mesterséges intelligencia technológiák, ez a képesség áll rendelkezésre, hogy több millió felhasználó a Skype több mint egy éve, és hogy iOS És Android használók-ból Mikroszkóp fordító apps óta késő 2015. Most, a vállalkozások képesek lesznek hozzáadni ezeket a beszédfordítási képességek, hogy az alkalmazások vagy szolgáltatások, és több természetes és hatékony felhasználói élményt az ügyfeleiknek és munkatársainak.

A Beszédfordítás nyolc nyelven érhető el – arab, Kínai mandarin, angol, francia, német, olasz, portugál és spanyol. A szöveg fordítása a Microsoft Translator 50 + támogatott nyelvek. A beszédhangos fordítás 18 támogatott nyelven érhető el.

Ez új változat-ból Mikroszkóp fordító van a első vég--hoz-vég beszéd fordítás oldat jobbá tett részére valóságos-élet beszélgetés (vs egyszerű emberi-hoz gép követel) elérhető-on piac. A mai napig a beszédfelismerési megoldások több különböző API-ból (beszédfelismeréssel, fordítással és beszédszintetizisból) álltak össze, és nem a társalgási beszédre, hanem az egymással való együttműködésre lettek tervezve. Mostantól a végfelhasználók és a vállalkozások egyaránt eltávolíthatják a nyelvi korlátokat a beszédfordítások integrálásával a megszokott alkalmazásokban és szolgáltatásokban.

 

Hogyan tud az én-m teendő használ beszéd fordítás technológia?

A Beszédfordítási szolgáltatások különféle személyek, csoportok vagy emberek közötti forgatókönyvekben használhatók. A személy-személy forgatókönyvek tartalmazhatnak egyirányú fordítást, például személyes fordítást, feliratozás vagy távoli, vagy személy szerint, többnyelvű kommunikációt hasonló módon, mint amit a skype fordító jelenleg talál, illetve a Microsoft Translator apps iOS és Android. Csoport forgatókönyv tudna tartalmaz valóságos-idő bemutatások mint esemény keynotes, Webcast és Egyetem osztályoz, vagy összejövetelek mint-ban — személy találkozó vagy online utcagyerek chatrooms. Az ember-gép forgatókönyvek tartalmazhatnak üzletiintelligencia-helyzeteket (például az elemzési vagy az ügyfélhívások naplóit) vagy az AI interakcióit.

Mi csak most kezdik semmiből a felszínre a forgatókönyvet, ahol ez a technológia segít, és mivel a gépi tanulás alapján, a minőség és ezért az alkalmazhatóság javulni fog az idő, ahogy egyre többen és vállalatok használják.

Több partnervállalat tesztelte az API-t és integrálni saját apps:

  • Tele 2 -ból svéd, egy vezető mozgatható telefonközpontos-val több mint 15 000 000 előfizetők-ban felső 15 országok, egységbe rendezett fordító-ba-uk PBX-hoz támogat valóságos-idő telefon hív fordítás (nem app szükséges!)-ra-uk sejtes hálózat.
  • LionBridge (Boston, MA), a nyelvi szolgáltató és a Gold Level Translator partner kifejlesztett egy integrált videó feliratozó megoldást.
  • A Prosüketek, egy alkalmazás eladó szakosodott technológiák fejlesztésére, hogy támogassa a kemény-a-hallás és a siketek közösségek, integrált az új API-ba jelnyelv avatar app, hogy többnyelvű támogatást a beszéd aláírására forgatókönyvek.

 

Hogyan működik a beszédfordítás?

A beszéd-beszéd fordítás nagyon összetett feladat. Használja a legújabb AI technológiákat, mint például a mély neurális hálózatokat a beszédfelismeréshez és a szövegfordításhoz. Nincs más, teljesen integrált beszédfordítási megoldás a mai piacon, és olyan platformot szállít, amely támogatja a valós idejű beszédfordítási forgatókönyveket, amelyek az egyszerű varrással együtt a meglévő beszédfelismerési és szövegfordítási technológiákat. Négy szakaszból áll a beszédfordítás, hogy képes legyen teljesíteni ezt az élményt:

  1. Automatikus beszédfelismerést (ASR) – A mély neurális hálózatot kiképzett több ezer órányi audió elemzi a bejövő beszédet. Ez a modell képzett emberi-to-humán kölcsönhatások helyett az ember-gép parancsokat, termelő beszédfelismerő, hogy van optimalizálva a normál beszélgetések.
  2. TrueText — A Microsoft Research innováció, TrueText veszi a szöveget, és átalakítja azt, hogy jobban tükrözi a felhasználói szándékot. Ez megvalósítja ezt azáltal, hogy megszünteti a disfluencies beszéd, mint a "UM" s és "ah", valamint a akadozik, és ismétlések. A szöveg is tenni olvashatóbb és lefordítható hozzáadásával mondat szünetek, megfelelő írásjelek, és a nagybetűs. (lásd az alábbi ábrát)
  3. Fordítás A szöveg lefordítható a Microsoft Translator által támogatott 50 + nyelvre. A nyolc beszédnyelv is tovább optimalizálták a beszélgetések a képzés több millió szó a társalgási adatok segítségével mély neurális hálózatokat hajtott nyelvi modellek.
  4. Szöveg beszéddé- Ha a cél nyelv van egyike a tizennyolc beszéd nyelvek támogatott, a szöveg van megtérít-ba beszéd termelés használ beszéd szintézis. Ez a szakasz nem szerepel a beszéd-a-szöveg fordítási forgatókönyvek, mint például a videó feliratozás.

Hogyan kezdj el?

-A ' könnyű-hoz kap kezdett-val a új Mikroszkóp fordító beszéd API. Ingyenes, 10 órás próbaverzió áll rendelkezésre aka.ms/TranslatorADMSpeech. Tudod kipróbálni a beállítás és a végrehajtás egy virtuális környezetben, valamint olvassa el az API dokumentációt az új A Swagger oldal. Találhatsz például alkalmazásokat és egyéb hasznos információkat Github.

Természetesen, ha kérdései, kérdések, vagy visszajelzést, szeretnénk hallani! Tudod, tudassa velünk a mi visszajelzés és támogatási fórum.

Tudjon Meg Többet