Vrijeme Jeli na glavniju
Prevoditelj
Ova stranica automatski je prevedena pomoću servisa za strojno prevođenje tvrtke Microsoft Translator. Saznajte više

Blog Microsoft prevoditelj

Microsoftov prevoditelj donosi kraj-do-end prijevod govora svima koji imaju prvi API za govor prevođenja na svijetu

Danas smo objavili novu verziju Microsoft Translator API koji dodaje sposobnosti prijevoda u stvarnom vremenu (i govora u tekst) za postojeći API prijevoda teksta. Ta je mogućnost bila dostupna milijunima korisnika u suvremenim tehnologijama umjetne inteligencije, Skype više od godinu dana, a firmware I Android Korisnici Microsoft Translator aplikacija od kasnog 2015. Sada će tvrtke biti u mogućnosti dodati ove mogućnosti prijevoda govora na svoje aplikacije ili usluge i ponuditi prirodnije i učinkovitije korisničko iskustvo svojim kupcima i osoblju.

Govor prijevod je dostupan za osam jezika — arapski, Kineski mandarinski, engleski, francuski, njemački, talijanski, portugalski i španjolski. Prijevod u tekst dostupan je u svim Microsoft Translator 50 + Podržani Jezici. Prijevod na govorni zvuk dostupan je na 18 podržanih jezika.

Ova nova verzija Microsoft Translator je prvi kraj-to-end rješenje za prijevod govora Optimizirano za stvarne razgovore (vs. jednostavne ljudske na strojne naredbe) dostupne na tržištu. Prije današnjeg dana, rješenja za prevođenje govora trebala su se spojiti s nizom različitih API-ja (prepoznavanje govora, prijevod i sinteza govora), nisu optimizirane za konverzacijski govor ili dizajnirani da rade jedni s drugima. Sada, krajnji korisnici i tvrtke podjednako mogu ukloniti jezične barijere s integracijom govornog prijevoda u svojim poznatim aplikacijama i uslugama.

 

Kako moja tvrtka može koristiti tehnologiju prevođenja govora?

Govor prijevod može se koristiti u različitim scenarijima osoba-za-osobe, grupe ili čovjek-stroj. Scenariji osobe na osobu mogu uključivati jedan način prijevoda kao što su osobni prijevod, titlovanje ili daljinska višejezalna komunikacija slična onome što se trenutno nalazi u programu Skype prevoditelj ili Microsoft Translator aplikacijama za iOS i Android. Scenariji grupe mogu uključivati prezentacije u stvarnom vremenu kao što su tipkovnice za događaje, webcasti i sveučilišni tečajevi ili okupljanja kao što su – sastanci osoba ili online gaming chatrooms. Scenariji ljudi-stroja mogu uključivati scenarije poslovne inteligencije (kao što su dnevnici analize ili kupaca) ili interakcije s AI.

Upravo počinjemo češati površinu scenarija u kojima će ta tehnologija pomoći i, budući da se temelji na strojnom učenju, njegova kvaliteta i stoga primjenjivost poboljšat će se s vremenom jer ih više ljudi i poduzeća koriste.

Nekoliko partnerskih tvrtki testirali su API i integrirali ga u vlastite aplikacije:

  • Teleskopi 2 Švedske, vodeći operater mobilnog operatera s više od 15.000.000 pretplatnika u više od 15 zemalja, integrirani Prevoditelj u svoj PBX za podršku u realnom vremenu telefonske pozive prijevodi (aplikacija nije potrebna!) na svojoj mobilnoj mreži.
  • Most LionBridge (Boston, MA), davatelj jezičnih usluga i partner Gold level Translator, razvio je integrirano rješenje za podtitranje videozapisa.
  • ProDeaf, dobavljač aplikacije specijalizira se za razvoj tehnologija za podršku teško sluha i gluhih zajednica, integrirao novi API u svoje znakovni jezik avatar app kako bi se omogućilo Višejezična podrška govora za potpisivanje scenarija.

 

Kako funkcionira prijevod govora?

Prijevod govora na govor vrlo je složen izazov. Koristi najnovije AI tehnologije, kao što su duboke neuronske mreže za prepoznavanje govora i tekst prevođenja. Ne postoji drugo potpuno integrirano rješenje za prevođenje govora koje je dostupno na tržištu danas i pružanje platforme koja bi podržala scenarije prevođenja u stvarnom životu koje su potrebne za više od jednostavnog šivanja postojećeg prepoznavanja govora i tehnologije za prevođenje teksta. Postoje četiri faze u prijevodu govora kako bi mogli isporučiti ovo iskustvo:

  1. Automatsko prepoznavanje govora (ASR) — Duboka neuronska mreža obučena na tisuće sati zvuka analizira dolazni govor. Ovaj model je obučen za interakciju ljudi i ljudi, a ne na naredbe čovjeka-stroja, stvarajući prepoznavanje govora koje je Optimizirano za normalne razgovore.
  2. TekstAkoIstinito Microsoft Research inovacija, TrueText uzima Doslovni tekst i pretvara ga u pobliže odražavati namjeru korisnika. To ostvaruje uklanjanjem disflunosti govora, kao što su "um" i "Ah", kao i muci i ponavljanja. Tekst je također napravljen čitljiviji i prevodiv dodavanjem prijeloma rečenica, pravilnog interpunkcije i kapitalizacije. (pogledajte sliku ispod)
  3. Prijevod Tekst se prevede na bilo koji od 50 + jezika koje podržava Microsoft Translator. Osam govornih jezika dodatno su optimizirane za razgovore treniranjem na milijune riječi konverzacijskim podacima pomoću dubokih jezičnog modela koji koriste duboke neuronske mreže.
  4. Tekst u govor — Ako je ciljni jezik jedan od osamnaest govornih jezika koji su podržani, tekst se pretvara u govorni izlaz pomoću sinteze govora. Ova faza se izostavlja u scenarijima prijevoda govora u tekst kao što je titlovi za videozapise.

Kako mogu početi?

Lako je početi s novim Microsoftovim API-Jima za govor. Besplatno 10-satni probni sat dostupan je na aka.ms/TranslatorADMSpeech. Možete testirati postavljanje i implementaciju u virtualnom okruženju, kao i pročitati API dokumentaciju na našem novom Stranica Swagger. Možete pronaći i primjere aplikacija i drugih korisnih informacija o Github.

Naravno, ako imate pitanja, pitanja ili povratnih informacija, voljeli bismo to čuti! Možete nam reći na našem povratne informacije i forum za podršku.

Saznajte Više