Tradução automática do Google Neural - Google Neural Machine Translation

O Google Neural Machine Translation (GNMT) é um sistema de tradução automática neural (NMT) desenvolvido pelo Google e lançado em novembro de 2016, que usa uma rede neural artificial para aumentar a fluência e a precisão no Google Translate .

O GNMT melhora a qualidade da tradução aplicando um método de tradução automática baseado em exemplos (EBMT) no qual o sistema "aprende com milhões de exemplos". A arquitetura proposta do GNMT de aprendizado de sistema foi testada pela primeira vez em mais de uma centena de idiomas suportados pelo Google Translate. Com a grande estrutura ponta a ponta, o sistema aprende com o tempo a criar traduções melhores e mais naturais. GNMT tenta traduzir frases inteiras de uma vez, ao invés de apenas pedaço por pedaço. A rede GNMT pode realizar tradução automática interlinguística codificando a semântica da frase, em vez de memorizar traduções frase a frase.

História

O projeto Google Brain foi estabelecido em 2011 no "laboratório de pesquisa secreto do Google X" pelo Google Fellow Jeff Dean , o pesquisador do Google Greg Corrado e o professor de ciência da computação da Universidade de Stanford Andrew Ng . O trabalho de Ng levou a alguns dos maiores avanços no Google e em Stanford.

Em setembro de 2016, uma equipe de pesquisa do Google anunciou o desenvolvimento do sistema Google Neural Machine Translation (GNMT) e em novembro o Google Translate começou a usar a tradução automática neural (NMT) em vez de seus métodos estatísticos anteriores (SMT), que eram usados ​​desde então Outubro de 2007, com sua tecnologia SMT proprietária interna.

O sistema NMT do Google Translate usa uma grande rede neural artificial capaz de aprendizado profundo . Usando milhões de exemplos, GNMT melhora a qualidade da tradução, usando um contexto mais amplo para deduzir a tradução mais relevante. O resultado é então reorganizado e adaptado para abordar a linguagem humana de base gramatical. A arquitetura proposta do GNMT de aprendizado de sistema foi testada pela primeira vez em mais de uma centena de idiomas suportados pelo Google Translate. GNMT não criou sua própria interlíngua universal, mas visou encontrar a semelhança entre muitas línguas usando insights da psicologia e linguística. O novo mecanismo de tradução foi habilitado pela primeira vez para oito idiomas: de e para inglês e francês, alemão, espanhol, português, chinês, japonês, coreano e turco em 2016. Em março de 2017, três idiomas adicionais foram habilitados: russo, hindi e vietnamita. com o tailandês, para o qual o suporte foi adicionado posteriormente. Suporte para hebraico e árabe também foi adicionado com a ajuda da comunidade do Google Translate no mesmo mês. Em meados de abril de 2017, o Google Holanda anunciou o suporte para holandês e outros idiomas europeus relacionados ao inglês. Suporte adicional foi adicionado para nove idiomas indianos: Hindi, Bengali, Marathi, Gujarati, Punjabi, Tamil, Telugu, Malayalam e Kannada no final de abril de 2017.

Avaliação

Diz-se que o sistema GNMT representa uma melhoria em relação ao antigo Google Translate, pois será capaz de lidar com a "tradução rápida", ou seja, traduzir diretamente um idioma para outro (por exemplo, japonês para coreano). O Google Translate primeiro traduziu o idioma de origem para o inglês e, em seguida, traduziu o inglês para o idioma de destino, em vez de traduzir diretamente de um idioma para outro.

Um estudo de julho de 2019 publicado no Annals of Internal Medicine descobriu que "o Google Translate é uma ferramenta viável e precisa para traduzir testes em outros idiomas". Apenas uma discordância entre os revisores que leram os ensaios traduzidos por máquina foi devido a um erro de tradução. Uma vez que muitos estudos médicos são excluídos das revisões sistemáticas porque os revisores não entendem a linguagem, o GNMT tem o potencial de reduzir o viés e melhorar a precisão de tais revisões.

Idiomas suportados pelo GNMT

Em outubro de 2020, o número de idiomas suportados pelo Google Translate aumentou para 109, com Kyrgrz, Bielo-russo, Latim, Maltês e Sudanês agora incluídos.

Veja também

Referências

links externos