Tradução automática híbrida - Hybrid machine translation

A tradução automática híbrida é um método de tradução automática caracterizado pelo uso de várias abordagens de tradução automática em um único sistema de tradução automática. A motivação para o desenvolvimento de sistemas híbridos de tradução automática deriva do fracasso de uma única técnica em atingir um nível satisfatório de precisão. Muitos sistemas híbridos de tradução automática têm sido bem-sucedidos em melhorar a precisão das traduções, e há vários sistemas populares de tradução automática que empregam métodos híbridos.

Abordagens

Multi-motor

Essa abordagem de tradução automática híbrida envolve a execução de vários sistemas de tradução automática em paralelo. A saída final é gerada combinando a saída de todos os subsistemas. Mais comumente, esses sistemas usam subsistemas de tradução estatísticos e baseados em regras, mas outras combinações foram exploradas. Por exemplo, pesquisadores da Carnegie Mellon University tiveram algum sucesso, combinando -base exemplo , à base de transferência , baseadas no conhecimento e estatística sub-sistemas de tradução em um sistema de tradução automática.

Geração de regra estatística

Essa abordagem envolve o uso de dados estatísticos para gerar regras lexicais e sintáticas . A entrada é então processada com essas regras como se fosse um tradutor baseado em regras . Essa abordagem tenta evitar a tarefa difícil e demorada de criar um conjunto de regras linguísticas abrangentes e refinadas, extraindo essas regras do corpus de treinamento. Esta abordagem ainda sofre de muitos problemas de tradução automática estatística normal , a saber, que a precisão da tradução dependerá muito da semelhança do texto de entrada com o texto do corpus de treinamento. Como resultado, essa técnica teve o maior sucesso em aplicações específicas de domínio e tem as mesmas dificuldades de adaptação de domínio que muitos sistemas de tradução automática estatística .

Multi-Pass

Essa abordagem envolve o processamento serial da entrada várias vezes. A técnica mais comum usada em sistemas de tradução automática multipass é pré-processar a entrada com um sistema de tradução automática baseado em regras . A saída do pré-processador baseado em regras é passada para um sistema de tradução automática estatística , que produz a saída final. Essa técnica é usada para limitar a quantidade de informações que um sistema estatístico precisa considerar, reduzindo significativamente o poder de processamento necessário. Também elimina a necessidade de o sistema baseado em regras ser um sistema de tradução completo para o idioma, reduzindo significativamente a quantidade de esforço humano e trabalho necessário para construir o sistema.

Baseado em confiança

Essa abordagem difere de outras abordagens híbridas porque, na maioria dos casos, apenas uma tecnologia de tradução é usada. Uma métrica de confiança é produzida para cada frase traduzida a partir da qual uma decisão pode ser tomada se tentar uma tecnologia de tradução secundária ou prosseguir com o resultado da tradução inicial. SMT também é usado quando padrões de erro comuns, como várias palavras repetidas, aparecem em sequência, como é comum com NMT quando o mecanismo de atenção é confuso.

Veja também

Referências