Je to v nádeji
Prekladateľ
Táto stránka bola automaticky preložená službou Prekladač strojového prekladu spoločnosti Microsoft. Dozvedieť sa viac

Microsoft prekladateľ blog

Microsoft Translator prináša end-to-end preklad reči pre každého, kto je prvý na svete reči preklad API

Dnes sme vydali novú verziu ROZHRANIE API prekladača Microsoft , ktorá pridáva preklad schopností prevodu reči na reč (a reči na text) do existujúceho rozhrania API na preklad textu. Je poháňaný najmodernejších technológií umelej inteligencie spoločnosti Microsoft, táto schopnosť bola k dispozícii miliónom používateľov Skype viac ako rok, a na iOS A Android používateľov aplikácií Microsoft Translator od neskorej 2015. Teraz, podniky budú môcť pridať tieto schopnosti reči prekladu do svojich aplikácií alebo služieb a ponúkajú viac prirodzené a efektívne užívateľské skúsenosti pre svojich zákazníkov a zamestnancov.

Preklad reči je k dispozícii pre osem jazykov – arabčina, Čínsky mandarín, angličtina, francúzština, nemčina, taliančina, portugalčina a španielčina. Preklad do textu je k dispozícii vo všetkých Microsoft Translator 50 + podporovaných jazykov. Preklad do hovoreného zvuku je k dispozícii v 18 podporovaných jazykoch.

Táto nová verzia Microsoft Translator je prvý end-to-end reči preklad riešenie optimalizované pre real-život konverzácie (vs jednoduchý človek na stroji príkazy) sú k dispozícii na trhu. Predtým, než dnes, reči preklad riešenia potrebné dláždené spoločne z niekoľkých rôznych API (rozpoznávanie reči, preklad a syntézu reči), neboli optimalizované pre konverzačné reči alebo navrhnuté pre spoluprácu medzi sebou navzájom. Teraz, koncoví používatelia a podniky môžu odstrániť jazykové bariéry s integráciou prekladu reči do svojich známych aplikácií a služieb.

 

Ako môže moja firma používať technológiu prekladu reči?

Preklad reči možno použiť v rôznych scenároch osoby na osobu, skupinu alebo človeka-stroj. Scenáre medzi osobami môžu zahŕňať jednosmerný preklad, ako je osobný preklad, titulkovanie alebo diaľkové alebo osobné viacjazyčné komunikácie podobné tým, čo sa v súčasnosti nachádza v programe Skype Translator alebo v aplikáciách Microsoft Translator pre iOS a Android. Skupinové scenáre môžu zahŕňať prezentácie v reálnom čase, ako sú napríklad poznámky k udalostným poznámkam, webové vysielania a univerzitné triedy, alebo stretnutia, ako napríklad schôdze osôb alebo online herné miestnosti. Scenáre medzi človekom a strojom môžu zahŕňať scenáre obchodnej inteligencie (napríklad analýzy alebo Denníky hovorov zákazníkov) alebo interakcie AI.

Sme ešte len začína poškriabať povrch scenárov, kde táto technológia pomôže, a ako to je strojové učenie založené, jeho kvalita, a preto uplatniteľnosť zlepší s časom, ako viac ľudí a spoločností, ktoré používajú.

Niekoľko partnerských spoločností otestovala rozhranie API a začlenili ho do svojich vlastných aplikácií:

  • Teľa 2 Švédsko, popredný mobilný operátor s viac ako 15 000 000 predplatiteľov vo viac ako 15 krajinách, integrovaný prekladateľ do ich PBX na podporu Real-time telefonické hovory preklady (žiadna aplikácia nutná!) na svojej mobilnej sieti.
  • Lionbridge (Boston, MA), poskytovateľ jazykových služieb a Gold Level Translator partner, vyvinul integrovaný video titulkovanie riešenie.
  • V meste ProDeaf, predajca aplikácií špecializujúca sa na vývoj technológií na podporu hard-of-sluchu a nepočujúcich komunít, integrované nové API do ich znakový jazyk avatar App umožniť multi-lingválnu podporu reči podpísať scenáre.

 

Ako funguje preklad reči?

Preklad reči na reč je veľmi zložitá výzva. Využíva najnovšie technológie AI, ako napríklad hlboké neurónové siete na rozpoznávanie reči a preklad textu. Neexistuje žiadne iné plne-integrované riešenie reči preklad k dispozícii na súčasnom trhu a prináša platformu, ktorá by podporila Real-Life reči prekladu scenáre potrebné ísť nad rámec jednoducho šitie dohromady existujúce rozpoznávanie reči a technológie textového prekladu. Existujú štyri etapy reči prekladu, aby mohli dodať túto skúsenosť:

  1. Automatické rozpoznávanie reči (ASR) — Hlboké neurónové siete vyškolení na tisíce hodín audio analyzuje prichádzajúce reči. Tento model je vyškolený na človeka-na-ľudskej interakcie skôr ako človek-na-stroj príkazy, produkovať rozpoznávanie reči, ktorý je optimalizovaný pre bežné konverzácie.
  2. PlatíText Inovácia programu Microsoft Research, TrueText má doslovný text a transformuje ho, aby užšie odrážal používateľský zámer. To dosahuje tým, že odstráni reči disflutory, ako je "UM" s a "Ah" s, rovnako ako koktat a opakovanie. Text je tiež čitateľný a prekladateľný pridaním vety prestávky, správne interpunkcia, a kapitalizácie. (pozri obrázok nižšie)
  3. Preklad Text je preložený do niektorého z 50 + jazykov podporovaných Microsoft Translator. Osem reči jazyky boli ďalej optimalizované pre rozhovory školenia na milióny slov konverzačné dáta pomocou hlboké neurónové siete poháňané jazykové modely.
  4. Text na reč – Ak je cieľovým jazykom jeden z osemnástich jazykov podporovaných reči, text sa skonvertuje na hlasový výstup pomocou syntézy reči. Táto fáza sa vynechá v scenároch prekladu reči na text, ako je napríklad titulkovanie videa.

Ako začať?

Je ľahké začať s novým Microsoft Translator Speech API. Bezplatná 10-hodinová skúšobná verzia je k dispozícii na aka.ms/TranslatorADMSpeech. Môžete testovať nastavenie a implementáciu vo virtuálnom prostredí, ako aj čítať dokumentáciu API na našej novej Swagger stránku. Môžete tiež nájsť príklady aplikácií a ďalších užitočných informácií o Github.

Samozrejme, ak máte otázky, problémy, alebo spätnú väzbu, radi by sme to počuli! Môžete nám dať vedieť o našich Spätná väzba a diskusné fórum.

Dozvedieť Sa Viac