Je to v nádeji
Prekladateľ
Táto stránka bola automaticky preložená službou Prekladač strojového prekladu spoločnosti Microsoft. Dozvedieť sa viac

Microsoft prekladateľ blog

Azure AI Custom Translator Neurónový slovník: Vyššia kvalita terminologického prekladu 

Dnes s veľkou radosťou oznamujeme vydanie neurónového slovníka, ktorý predstavuje významné zlepšenie kvality prekladu na našej platforme. V tomto blogovom príspevku sa budeme venovať funkcii neurónového slovníka.

Úvod  

Neurónový slovník je rozšírením nášho dynamický slovník A slovník fráz funkcie v Azure AI Translator. Obe umožňujú našim používateľom prispôsobiť výstup prekladu poskytnutím vlastných prekladov pre konkrétne výrazy alebo frázy. Naša predchádzajúca metóda používala doslovný slovník, čo bola presná operácia nájdi a nahraď. Neurónový slovník zlepšuje kvalitu prekladu viet, ktoré môžu obsahovať preklad jedného alebo viacerých termínov, tým, že umožňuje modelu strojového prekladu prispôsobiť termín aj kontext tak, aby vznikol plynulejší preklad. Zároveň zachováva vysokú presnosť prekladu termínov.  

Nasledujúci anglicko-nemecký príklad demonštruje rozdiely vo výstupoch prekladu medzi oboma metódami, keď sa požaduje preklad vlastnej terminológie: 

Vstupné údaje:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Verbálny slovník:   Grundkenntnisse der regelmäßigES Testsk 
Neurónový slovník:   Grundkenntnisse des regelmäßigsk Testens 

Zlepšenie kvality 

Nižšie uvedený graf znázorňuje výrazné zlepšenie, ktoré nová funkcia prináša v bežných verejne dostupných testovacích súboroch terminológie v automobilovom priemysle (https://aclanthology.org/2021.eacl-main.271), zdravie (https://aclanthology.org/2021.emnlp-main.477) a domény Covid-19 (https://aclanthology.org/2021.wmt-1.69) pomocou našich všeobecných prekladových modelov. 

Uskutočnili sme tiež sériu zákazníckych hodnotení platformy Custom Translator a modelov neurónových slovníkov. Merali sme nárast kvality prekladu na zákazníckych údajoch medzi modelmi s rozšírením neurónového slovníka a bez neho. Zúčastnilo sa na nich päť zákazníkov, ktorí sa zaoberali nemčinou, španielčinou a francúzštinou v rôznych obchodných doménach.

Nasledujúci graf ukazuje priemerné zlepšenie COMET v oblasti vzdelávania pre anglicko-nemecký, anglicko-španielsky a anglicko-francúzsky jazyk; pre všeobecné modely vľavo a pre prispôsobené modely vpravo. MODRÉ farebné stĺpce predstavujú všeobecnú kvalitu prekladu bez neurónového slovníka a ORANŽOVÉ farebné stĺpce predstavujú kvalitu prekladu s použitím neurónového slovníka. Ide o celkové priemerné zlepšenia na celých testovacích súboroch. V prípade segmentov, ktoré obsahujú jedno alebo viac zákazníckych slovníkových hesiel (od 19 % do 63 %), je zlepšenie až +6,3 až +12,9 bodu COMET. 

 Podporované jazyky  

  • Aktuálne k dispozícii (od 6. decembra 2023): do a z angličtiny: zjednodušená čínština, francúzština, nemčina, taliančina, japončina, kórejčina, poľština, ruština, španielčina a švédčina.  
  • V budúcnosti pridáme ďalšie. Aktualizácie nájdete na stránke Poznámky k vydaniu vlastného prekladača 

Ako funguje neurónový slovník 

Neurónový slovník nepoužíva presnú operáciu nájdi a nahraď pri spracovaní vlastného terminologického prekladu. Namiesto toho prekladá termíny alebo frázy zo slovníka spôsobom, ktorý najlepšie zodpovedá celému kontextu. To znamená, že termín sa môže skloňovať alebo mať iné pádové tvary, prípadne sa môžu upraviť okolité slová, čím sa dosiahne plynulejší a súvislejší preklad.  

Povedzme, že máme napríklad nasledujúcu vstupnú vetu v angličtine a jej preklad do poľštiny bez slovníkových fráz je nasledovný:  

Vstupné údaje:   Potrebujeme rýchle riešenie, ktoré bude zrozumiteľné.  
Štandardný preklad:   Potrebujeme szybkiego rozwiązania, które będzie zrozumiałe.  

Ak sa chcete uistiť, že sa slovo "solution" prekladá ako "alternatíva" ("alternatíva" v angličtine), môžete pridať dynamickú anotáciu slovníka, aby ste to dosiahli:  

Vstupné údaje:   We need a fast <mstrans:dictionary translation=”alternatíva“>solution</mstrans:dictionary> that will be understandable.  
Verbálny slovník:   Potrebujeme rýchlyego alternatíva, który bude zrozumiały.  
Neurónový slovník:   Potrebujeme rýchlyej alternatíva., którA bude zrozumiałA.  

Výstup vytvorený predchádzajúcou metódou nie je plynulý, pretože sa porušuje gramatická rodová konzistencia. Neurónový slovník produkuje plynulý výstup tým, že a) skloňuje požadovanú náhradu a b) mení okolité slová, ak je to potrebné. V niektorých prípadoch môže zmeniť aj pád, ako v nasledujúcom príklade:  

Vstupné údaje:   This company’s <mstrans:dictionary translation=”Akcie“>stock</mstrans:dictionary> is cheap.  
Verbálny slovník:   Akcie Táto firma žart tani.  
Neurónový slovník:   Akcie Táto firma tanie.   

Neurónový slovník očakáva, že požadovaný preklad termínu je poskytnutý v jeho základnom gramatickom tvare. Podporované sú aj viacslovné termíny, ktoré by mali byť poskytnuté ako podstatné mená, t. j. slová by nemali byť lematizované samostatne (napríklad "estónske parlamentné voľby" bude lepšie ako "estónske parlamentné voľby"). 

Ako povoliť neurónový slovník 

Pre všetky podporované jazyky uvedené vyššie je neurónový slovník okamžite k dispozícii pre všetkých zákazníkov, ktorí používajú platformu Custom Translator s slovníky fráz. Na zapnutie neurónového slovníka je potrebné úplné (alebo len slovníkové) preškolenie vlastného modelu. 

 Odporúčania 

  1. Ak chcete zabezpečiť, aby sa heslo frázového slovníka pri práci s neurónovým slovníkom používalo častejšie, môžete zvážiť pridanie hesla frázy so zdrojovou časťou v rôznych formách. Vo vyššie uvedenom príklade sa vedľa položky "solution _ alternatíva", môžete pridať aj nasledujúce položky: "Riešenie _ alternatíva", "riešenia _ alternatívne", "Riešenia _ alternatívne".  
  2. Ak je cieľom zabezpečiť, aby sa konkrétne slovo alebo slovné spojenie pri použití slovníka fráz skopírovalo zo vstupného textu do výstupného prekladu "tak, ako je", zvážte presadenie slovníka doslovného prekladu, pretože môže byť konzistentnejší.   
  3. Vyhnite sa pridávaniu prekladov bežných alebo často používaných slov alebo fráz do slovníka fráz.  

Ak sa chcete dozvedieť viac o Custom Translator a o tom, ako môže pomôcť vašej firme prosperovať na globálnom trhu, začnite Vlastná príručka prekladateľa pre začiatočníkov. 

Možnosti prispôsobenia sa vlastnému prekladaču spoločnosti Microsoft 

Vytvorte si vlastné modely s terminológiou špecifickou pre vašu doménu a preveďte ich v reálnom čase pomocou ROZHRANIE API prekladača Microsoft. 

Použiť Vlastný prekladač spoločnosti Microsoft s vašimi prekladateľskými riešeniami, ktoré vám pomôžu globalizovať vaše podnikanie a zlepšiť interakciu so zákazníkmi. 

Viac informácií nájdete na stránke Obchodné riešenia Microsoft Translator A Poznámky k vydaniu vlastného prekladača.