Pereiti prie pagrindinio turinio
Vertėjas
Šis puslapis automatiškai išverstas į "Microsoft Translator" mašininio vertimo tarnybą. Sužinokite daugiau

Microsoft Translator Dienoraštis

Vertimo kokybės testavimas: Svečių dienoraštis

Anand Chakravarty yra SDET dėl mašininio vertimo komanda per pastaruosius 2,5 metų, buvo ne "Microsoft" 8 metus, ir buvo pirmasis produktas testeris MT komanda (ir "vis dar smagiai su bandymų MT:-)").  Šiandien svečias dienoraštis apie bandymus vertimo kokybę. 

—————————————————————————————————————

Vienas iš pirmųjų punktų, kurie ateina į galvą, kai kalbame apie patikrinti vertimo sistemos kokybę, yra, kaip jūs vertinate kokybę, ar turi būti tiksli, vertimo tikslumą? Versti tarp žmonių kalbų naudojant kompiuterius yra laukas, kuris yra beveik pusė amžiaus. Ši sritis yra pakankamai sudėtinga, kad net geriausios šiuo metu turimos mašininio vertimo sistemos nėra arti kalbos kokybės, kuri būtų visiškai patenkinama, gavimo.

Dalis iššūkis yra daug įvairių duomenų taškų, kad žmonės proceso, siekiant suprasti prasmę kalbėjo/parašytas tekstas. Yra Sintaksė, parsing, semantika, kontekstas, reikšmės, pertvarkymas, visa tai ir dar daugiau, eikite į sakinio supratimą. Ir tai tik sakinys 1 kalba. Dabar Apsvarstykite galimybę taikyti visa tai atstatyti nuosprendį kita kalba ir padaryti jį vienodai prasmingas.

Keletas pavyzdžių gali padėti aiškiau apibrėžti šį punktą. Sąvoka "Olimpinės žaidynės 2008" yra gana nedviprasmiška. Be to, galima tikėtis, kad terminas "rinkimai 2008" reiškia JAV prezidento rinkimus. Tačiau, jei vartotojas yra iš, tarkim, Kanadoje, tai labiau tikėtina, kad nuoroda į vietos rinkimus ten.

Bendresnė, taigi ir labiau paplitęs pavyzdys yra sakinys kaip "Pastaba buvo neteisinga". Ar žodis "Pastaba" nuoroda į informacinį pranešimą arba į muzikinį terminą? Tinkamas vertimas priklauso nuo konteksto. Naudokite daugiau konteksto, ir jūsų šansai gauti tikslesnius vertimo pagerinti. Tačiau tai kainuoja: kuo daugiau konteksto sistema bando gauti, tuo lėčiau jos efektyvumą. Išmanūs laivybos sprendimai apima tinkamą pusiausvyrą tarp vertimo tikslumo gerinimo ir įgyvendinamų vertimo rezultatų vartotojams. Žinoma, abu yra svarbūs. Svarbiausia yra suprasti, kur jūs tiesiogiai stengtis tobulinti, priklausomai nuo to, kaip naudinga galutinis rezultatas yra vartotojui.

Tai tampa ypač įdomi verčiant dokumentus ar interneto puslapius, o ne tik atskirus sakinius. Sakykime, vertimo užklausa buvo gauta už interneto puslapį, kuriame yra 100 sakiniai. Priklausomai nuo vertimo sistemos architektūra, šie sakiniai gali visi eiti į vieną procesą, arba būti platinamas per kelis procesus/mašinos. Bet kuriuo atveju, akivaizdu, kad laikas, kurio buvo imtasi išversti šį puslapį, yra proporcingas didžiausiam laiko, kurio buvo imtasi išversti sakinį. Kaip ilgai mes praleidžiame versti sakinį, kad investuotas laikas tampa žalingas vartotojo laiko? Siekiant geriausio vertimo, mes galime baigti blokuoti vartotoją gauti ką nors informatyvus atsakant į jų vertimo prašymą. Todėl sistemos naudingumą reglamentuoja sprendimai, kurie yra priimami siekiant subalansuoti lingvistinę kokybę ir taikymo rezultatus.

Su Microsoft Translator produktas, yra papildoma funkcija mūsų dvikalbį žiūrovas, kažkas unikali tarp viešai prieinamų vertimo produktus. Jis palaiko lygiagrečiai tekstas išryškinimas, sinchronizuoti slinkties ir pristato puslapį (-ius) su progressive utilizavimo. Tai prideda kitą sluoksnį, ką mūsų vartotojai mato, ir todėl kitą sluoksnį lenkų ir apdaila.

Per ateinančias savaites tikimės pateikti daugiau informacijos apie konkrečias sritis, kurios buvo ir yra išbandytos, kad būtų galima išsiųsti aukščiausios kokybės vertimo sistemą. Nedvejodami rašyti visus klausimus turite šiuo klausimu, nors jūs visada norėjo paklausti:-), į komentarai skyriuje.