Pular para o conteúdo principal
Translator
Esta página foi traduzida automaticamente pelo serviço de tradução automática do Microsoft Translator. Saiba Mais

Microsoft Tradutor blog

As traduções do Bing com base no género abordam o preconceito na tradução

Desbias de género
Renderização 3D de símbolos de género.

Estamos entusiasmados por anunciar que, a partir de hoje, estão disponíveis traduções alternativas masculinas e femininas para quando se traduz de inglês para espanhol, francês, ou italiano. Pode experimentar esta nova funcionalidade em ambas Pesquisa do Bing e Bing Tradutor verticalmente.

Ao longo dos últimos anos, o campo da tradução automática (MT) foi revolucionado pelo advento dos modelos de transformadores, levando a enormes melhorias na qualidade. No entanto, modelos optimizados para capturar as propriedades estatísticas dos dados recolhidos do mundo real aprendem inadvertidamente ou mesmo amplificam os preconceitos sociais encontrados nesses dados.

O nosso último lançamento é um passo no sentido de reduzir um destes preconceitos, especificamente o preconceito de género que é predominante nos sistemas de MT. Bing Translator sempre produziu uma única tradução para uma frase de entrada mesmo quando as traduções poderiam ter tido outras variações de género, incluindo variantes femininas e masculinas. De acordo com a Princípios de IA responsável da MicrosoftQueremos assegurar que fornecemos traduções alternativas correctas e que somos mais inclusivos para todos os géneros. Como parte desta viagem, o nosso primeiro passo é fornecer variantes de tradução femininas e masculinas.

O género é expresso de forma diferente nas diferentes línguas. Por exemplo, em inglês, a palavra advogado poderia referir-se a um indivíduo do sexo masculino ou feminino, mas em espanhol, abogada referir-se-ia a uma advogada, enquanto abogado referir-se-ia a um macho. Na ausência de informação sobre o género de um substantivo como "advogado" numa frase de origem, os modelos MT podem recorrer à selecção de um género arbitrário para o substantivo na língua-alvo. Muitas vezes, estas atribuições arbitrárias de género alinham com estereótipos, perpetuando preconceitos sociais prejudiciais (Stanovsky et al., 2019; Ciora et al., 2021) e levando a traduções que não são totalmente exactas.

No exemplo abaixo, nota-se que ao traduzir frases neutras do inglês para o espanhol, o texto traduzido segue o papel estereotipado do género, ou seja, o advogado é traduzido como sendo masculino.

Tradução com preconceitos de género
Imagem de tradução do texto inglês "Let's get our lawyer's opinion on this issue" para a língua espanhola, com preconceitos de género.

Como não há contexto na frase de origem que implique o sexo do advogado, produzir uma tradução com a presunção de um advogado ou de uma advogada seria ambos válidos. Agora, a Bing Translator produz traduções com formas tanto femininas como masculinas.

Tradução de texto inglês ambíguo de género para espanhol
Imagem de tradução do texto inglês "Let's get our lawyer's opinion on this issue" para a língua espanhola com traduções específicas de género.

Concepção do sistema

O nosso objectivo era conceber o nosso sistema de modo a satisfazer os seguintes critérios-chave para proporcionar alternativas com base no género:

  1. As variantes feminina e masculina devem ter diferenças mínimas, excepto as necessárias para transmitir o género.
  2. Queríamos cobrir uma vasta gama de frases onde são possíveis múltiplas alternativas de género.
  3. Queríamos assegurar que as traduções preservassem o significado da frase de origem original.

Detectar ambiguidade de género

A fim de detectar com precisão a ambiguidade de género no texto original, utilizamos um modelo de referência para analisar as entradas contendo substantivos animados. Por exemplo, se um dado texto de entrada contém uma palavra profissional neutra em termos de género, só queremos fornecer-lhe alternativas de género quando o seu género não puder ser determinado por outras informações na frase. Por exemplo: Ao traduzir para francês uma frase em inglês "The lawyer met her driver at the hotel lobby", podemos determinar que o advogado é do sexo feminino, enquanto o sexo do condutor é desconhecido.

Tradução de texto inglês ambíguo de género para francês
Imagem de tradução do texto inglês "The lawyer meet her driver at the hotel lobby" para a língua francesa.

Gerar tradução alternativa

Quando a frase de origem é ambiguamente sexuada, examinamos os resultados do nosso sistema de tradução para decidir se é possível uma interpretação alternativa de género. Em caso afirmativo, procedemos para determinar a melhor forma de rever a tradução. Começamos por construir um conjunto de traduções alvo candidatas, reescrevendo a tradução original. Aplicamos restrições linguísticas baseadas em relações de dependência para assegurar a consistência nas alternativas propostas e podamos os candidatos errados.

No entanto, em muitos casos, mesmo depois de aplicarmos as nossas restrições, ficamos com múltiplas reescritas de candidatos para a tradução alternativa com base no género. Para determinar a melhor opção, avaliamos cada candidato, pontuando-o com o nosso modelo de tradução. Ao aproveitar o facto de que uma boa reescrita de género será também uma tradução precisa da frase de origem, somos capazes de assegurar uma elevada precisão na nossa produção final.

Concepção do sistema de re-inflexão de género
Um diagrama mostrando a concepção do sistema de re-inflexão de género.

Alavancagem dos pontos finais geridos em linha na aprendizagem de máquinas Azure

A característica alternativa de género no Bing está alojada em pontos finais geridos em linha em Azure Machine Learning. Os endpoints online geridos fornecem uma interface unificada para invocar e gerir implementações de modelos em computação gerida pela Microsoft de uma forma chave na mão. Permitem-nos tirar partido de endpoints escaláveis e fiáveis sem nos preocuparmos com a gestão de infra-estruturas. Este ambiente de inferência também permite o processamento de um grande número de pedidos com baixa latência. A nossa capacidade de criar e implementar o serviço de debias de género com as mais recentes estruturas e tecnologias foi grandemente melhorada através da utilização de funcionalidades de inferência gerida no Azure Machine Learning. Ao aproveitar estas características, conseguimos manter um baixo COGS (Custo dos Produtos Vendidos) e garantir uma segurança e conformidade de privacidade simples.

Como pode contribuir?

Para facilitar o progresso na redução de preconceitos de género na MT, estamos a lançar um corpo de teste contendo exemplos de tradução ambíguos de género do inglês para o espanhol, francês e italiano. Cada frase de origem inglesa é acompanhada de múltiplas traduções, cobrindo cada possível variação de género.

O nosso conjunto de testes é construído para ser desafiante, morfologicamente rico e linguisticamente diversificado. Este corpus tem sido instrumental no nosso processo de desenvolvimento. Foi desenvolvido com a ajuda de um linguista bilingue com experiência significativa em tradução. Estamos também a lançar um documento técnico que discute em pormenor o corpus de teste e a metodologia e ferramentas de avaliação.

GATE: Um desafio lançado para Exemplos de Tradução Ambíguos em termos de Género - Documento

GATE: Um conjunto de desafios para Exemplos de Tradução de Género-Ambíguo - Conjunto de testes

Caminho a seguir

Através deste trabalho pretendemos melhorar a qualidade da produção de MT em casos de género de fonte ambígua, bem como facilitar o desenvolvimento de melhores e mais inclusivas ferramentas de processamento de linguagem natural (PNL) em geral. A nossa versão inicial centra-se na tradução de inglês para espanhol, francês e italiano. No futuro, planeamos expandir para novos pares de línguas, bem como cobrir cenários adicionais e tipos de enviesamentos.

Créditos:

Ranjita Naik, Spencer Rarrick, Sundar Poudel, Varun Mathur, Jeshwanth Kumar Chandrala, Charan Mohan, Lee Schwartz, Steven Nguyen, Amit Bhagwat, Vishal Chowdhary.