Preskoči na glavno vsebino
Prevajalec
Ta stran je bila samodejno prevedena s strojno prevajanje Microsoft Translator storitev. Preberite več

Microsoftov prevajalec blog

Bingovi prevodi na podlagi spola obravnavajo pristranskost pri prevajanju

Odpravljanje pristranskosti glede na spol
3D upodabljanje spolnih simbolov.

Z veseljem sporočamo, da so od danes na voljo alternativni prevodi v moški in ženski spol za prevajanje iz angleščine v španščino, francoščino ali italijanščino. To novo funkcijo lahko preizkusite v obeh Iskanje po storitvi Bing In Prevajalec Bing vertikale.

V zadnjih nekaj letih se je na področju strojnega prevajanja (MT) zgodil preobrat, saj so se pojavili transformatorski modeli, ki so omogočili ogromno izboljšanje kakovosti. Vendar se modeli, optimizirani za zajemanje statističnih lastnosti podatkov, zbranih iz resničnega sveta, nehote naučijo ali celo okrepijo družbene pristranskosti, ki jih najdemo v teh podatkih.

Naša najnovejša izdaja je korak k zmanjšanju ene od teh pristranskosti, zlasti pristranskosti glede na spol, ki prevladuje v sistemih MT. Prevajalnik Bing Translator je za vhodni stavek vedno pripravil en prevod, tudi če so bile v prevodu lahko druge različice spola, vključno z ženskim in moškim spolom. V skladu s Microsoftova načela odgovorne umetne inteligence, želimo zagotoviti pravilne alternativne prevode in biti bolj vključujoči za vse spole. Kot del te poti je naš prvi korak zagotavljanje različic prevodov za ženski in moški spol.

Spol se v različnih jezikih izraža različno. Na primer, v angleščini se beseda odvetnik lahko nanaša na posameznika moškega ali ženskega spola, v španščini pa, abogada bi se nanašala na odvetnico, medtem ko abogado bi se nanašala na moškega. Če v izvornem stavku ni podatkov o spolu samostalnika, kot je "odvetnik", se lahko modeli MT zatečejo k izbiri poljubnega spola za samostalnik v ciljnem jeziku. Pogosto se te poljubne dodelitve spola ujemajo s stereotipi, kar ohranja škodljive družbene predsodke (Stanovsky et al., 2019; Ciora et al., 2021) in vodi v prevode, ki niso povsem natančni.

V spodnjem primeru opazite, da pri prevajanju spolno nevtralnih stavkov iz angleščine v španščino prevedeno besedilo sledi stereotipni spolni vlogi, tj. odvetnik je preveden kot moški.

Prevajanje s pristranskostjo glede na spol
Posnetek zaslona prevoda angleškega besedila "Let's get our lawyer's opinion on this issue." v španski jezik s spolno pristranskostjo.

Ker v izvornem stavku ni konteksta, ki bi nakazoval spol odvetnika, bi bil prevod s predpostavko, da gre za odvetnika moškega ali ženskega spola, pravilen. Sedaj Bing Translator pripravi prevode z žensko in moško obliko.

Prevajanje spolno dvoumnega angleškega besedila v španščino
Zaslonska slika prevoda angleškega besedila "Let's get our lawyer's opinion on this issue." v španski jezik s prevodi, ki se nanašajo na spol.

Oblikovanje sistema

Naš sistem je bil zasnovan tako, da je izpolnjeval naslednja ključna merila za zagotavljanje alternativnih možnosti glede na spol:

  1. Ženske in moške različice naj se razlikujejo le minimalno, razen tistih, ki so potrebne za izražanje spola.
  2. Želeli smo zajeti široko paleto stavkov, pri katerih je možnih več spolnih alternativ.
  3. Želeli smo zagotoviti, da prevodi ohranijo pomen izvirnega stavka.

Odkrivanje dvoumnosti spola

Za natančno odkrivanje spolne dvoumnosti v izvornem besedilu uporabljamo model koreferenčnega sklicevanja za analizo vnosov, ki vsebujejo animirane samostalnike. Če na primer določeno vhodno besedilo vsebuje spolno nevtralno strokovno besedo, želimo zanjo zagotoviti spolne alternative le, če njenega spola ni mogoče določiti na podlagi drugih informacij v stavku. Na primer: Pri prevajanju angleškega stavka "The lawyer met her driver at the hotel lobby." v francoščino lahko ugotovimo, da je odvetnica ženska, medtem ko spol voznika ni znan.

Prevajanje spolno dvoumnega angleškega besedila v francoščino
Posnetek zaslona prevoda angleškega besedila "The lawyer met her driver at the hotel lobby." v francoski jezik.

Ustvarjanje nadomestnega prevoda

Kadar je izvorni stavek dvoumno spolno opredeljen, preverimo rezultate našega prevajalskega sistema in ugotovimo, ali je možna drugačna razlaga spola. Če je odgovor pritrdilen, določimo najboljši način za popravek prevoda. Začnemo z oblikovanjem niza kandidatnih ciljnih prevodov s prepisovanjem izvirnega prevoda. Uporabimo jezikovne omejitve, ki temeljijo na odvisnostnih razmerjih, da zagotovimo skladnost predlaganih alternativnih prevodov in izločimo napačne kandidate.

Vendar pa v številnih primerih tudi po uporabi naših omejitev ostane več možnih prepisov za alternativni prevod, ki se nanaša na spol. Da bi določili najboljšo možnost, vsakega kandidata ocenimo tako, da ga točkujemo z našim prevajalskim modelom. Z uporabo dejstva, da bo dober prepis za spol tudi natančen prevod izvornega stavka, lahko zagotovimo visoko natančnost našega končnega rezultata.

Načrtovanje sistema za ponovni odražanje spola
Diagram, ki prikazuje zasnovo sistema za ponovno refleksijo spola.

Uporaba upravljanih spletnih končnih točk v Azure Machine Learning

Alternativna funkcija za spol v storitvi Bing je nameščena v upravljane spletne končne točke v orodju Azure Machine Learning. Upravljane spletne končne točke zagotavljajo poenoten vmesnik za priklic in upravljanje postavitev modelov na računalnikih, ki jih upravlja Microsoft, na način "na ključ". Omogočajo nam, da izkoristimo prednosti skalabilnih in zanesljivih končnih točk, ne da bi se ukvarjali z upravljanjem infrastrukture. To okolje za sklepanje omogoča tudi obdelavo velikega števila zahtevkov z majhno zakasnitvijo. Naša zmožnost ustvarjanja in uvajanja storitve debias spola z najnovejšimi ogrodji in tehnologijami se je močno izboljšala z uporabo upravljanih funkcij inference v Azure Machine Learning. Z uporabo teh funkcij smo lahko ohranili nizke stroške prodanega blaga (COGS) ter zagotovili neposredno skladnost z varnostjo in zasebnostjo.

Kako lahko prispevate?

Da bi pospešili napredek pri zmanjševanju spolne pristranskosti v MT, objavljamo testni korpus s primeri prevodov iz angleščine v španščino, francoščino in italijanščino, ki so enoznačni glede na spol. Vsak angleški izvorni stavek spremlja več prevodov, ki zajemajo vse možne različice spola.

Naš testni niz je sestavljen tako, da je zahteven, morfološko bogat in jezikovno raznolik. Ta korpus je bil ključnega pomena za naš razvojni proces. Razvit je bil s pomočjo dvojezičnih jezikoslovcev z bogatimi prevajalskimi izkušnjami. Objavljamo tudi tehnični članek, ki podrobno obravnava testni korpus ter metodologijo in orodja za vrednotenje.

GATE: izziv za spolno dvoumne prevodne primere - dokument

GATE: Izziv za spolno dvoumne prevodne primere - testni niz

Pot naprej

S tem delom želimo izboljšati kakovost izpisa MT v primerih dvoumnega izvornega spola ter na splošno olajšati razvoj boljših in bolj vključujočih orodij za obdelavo naravnega jezika (NLP). Naša prva izdaja se osredotoča na prevajanje iz angleščine v španščino, francoščino in italijanščino. V prihodnje načrtujemo razširitev na nove jezikovne pare ter vključitev dodatnih scenarijev in vrst pristranskosti.

Krediti:

Ranjita Naik, Spencer Rarrick, Sundar Poudel, Varun Mathur, Jeshwanth Kumar Chandrala, Charan Mohan, Lee Schwartz, Steven Nguyen, Amit Bhagwat, Vishal Chowdhary.