A tradución automática (TA) é unha ferramenta esencial para mellorar a comunicación entre linguas, especialmente para aquelas con menor presenza dixital, como o galego. En imaxin, con máis de 20 anos de experiencia no desenvolvemento de solucións lingüísticas, mantemos un compromiso constante coa innovación en tradución automática. A rápida evolución da intelixencia artificial fai imprescindible coñecer e avaliar os recursos máis avanzados dispoñibles, tanto para a tradución automática como para outras áreas do procesamento da linguaxe natural (PLN).

Recentemente, en colaboración coa Universidade do País Vasco (EHU), a nosa compañeira Sofía García realizou unha investigación no marco da súa tese industrial, centrada en identificar os sistemas de tradución automática máis efectivos para o galego. Este estudo, adaptado ás necesidades dunha pequena e mediana empresa (peme), representa a avaliación máis exhaustiva realizada ata o momento na tradución automática para o galego, ademais do primeiro estudo en TA que inclúe o portugués-galego dentro dunha avaliación xenérica. Os resultados desta análise foron presentados o pasado 25 de setembro no congreso anual da Sociedade Española do Procesamento da Linguaxe Natural (SEPLN) 2025, celebrado en Zaragoza.

Neste congreso, recoñecido como un evento de referencia en tecnoloxías da linguaxe no ámbito hispano, tivemos a oportunidade de conectar con empresas e institucións do PLN tanto a nivel estatal como internacional. Este encontro facilitou o intercambio de coñecementos e a creación de lazos tanto académicos como empresariais. Ademais, escoitamos intervencións de figuras destacadas no sector, como Marta R. Costa-jussà, investigadora científica en META, así como doutros expertos de diversas disciplinas, o que nos permitiu ampliar a nosa perspectiva e identificar novas oportunidades para innovar dentro da nosa empresa.

Obxectivo do estudo

O estudo tiña como obxectivo identificar os modelos de tradución automática de licenza libre máis efectivos para os pares de linguas inglés‑galego, español‑galego e portugués‑galego no dominio xeral. Entre os tres pares, avaliáronse un total de 45 sistemas en 23 tests de avaliación tendo en conta tres factores principais:

- Calidade do modelo: precisión das traducións producidas
- Varianza no rendemento: consistencia dos modelos en distintos datasets de avaliación
- Tamaño do modelo: eficiencia computacional no contexto dunha peme

Metodoloxía

A investigación avaliou catro tipos principais de sistemas de tradución automática:

- Sistemas baseados en regras: Apertium. Para esta avaliación non se empregou a versión liberada, senón o sistema de pago da nosa plataforma Opentrad, tamén implantado en Gaio, o sistema de tradución automática oficial da Xunta de Galicia.
- Modelos neuronais bilingües: sistemas sequence-to-sequence especializados nun par de linguas.
- Modelos neuronais multilingües: sistemas sequence-to-sequence que inclúen múltiples linguas simultaneamente.
- Grandes modelos de linguaxe (LLM): tanto non instruídos, como Llama-3.1.-Carballo; instruídos, como os modelos de EuroLLM; ou axustados para tradución automática, como os modelos de LlaMAX.

Principais resultados

- Español-galego: onde os máis pequenos aínda compiten
  Para o par español-galego, o sistema Opentrad e o modelo neuronal bilingüe do Proxecto Nós seguen a ser competitivos cos modelos multilingües e os LLM. Isto demostra que entre linguas próximas e de poucos recursos, os sistemas máis pequenos aínda poden funcionar. De maneira que, ademais de dar bos resultados, aforran custos económicos e computacionais e son unha alternativa menos contaminante que modelos máis grandes
- Inglés-galego: a forza dos modelos multilingües
  Para o par inglés galego, os modelos multilingües como madlad demostraron unha calidade superior, aproveitando o coñecemento que teñen de distintas linguas de moitos recursos (high resource languages, HRL) para facer transferencia de coñecementos ás linguas con menos recursos (low resource languages, LRL).
- Portugués-galego: un campo por explorar
  O par portugués-galego deu uns resultados sorprendentemente baixos en canto a métricas. A pesar de seren dúas linguas moi próximas, os resultados caeron por debaixo do inglés-galego de media. Isto chama a atención, xa que normalmente os pares de linguas próximas obteñen mellores resultados que os pares de linguas máis distantes.
  Un dos posibles motivos foi a escaseza de tests de avaliación. Para portugués galego só existen tests de referencia multilingües e de dominio xenérico, coñecidos como benchmarks, a maioría coas variantes europea e brasileira mesturadas. É por isto que consideramos os resultados inconclusos. Urxe a creación de bos tests de avaliación neste par de linguas, tanto de dominio xenérico como específico e que permitan avaliar propiamente a variante europea do portugués, por ser esta de grande interese dada a proximidade tanto lingüística como xeográfica entre o galego e o portugués europeo.
  Cinguíndonos propiamente á avaliación feita no artigo, o modelo nllb-muele-54b, foi o que obtivo mellores resultados en canto ás métricas de avaliación da calidade. Aínda así, reiteramos a necesidade de investigar este par con máis profundidade para conseguir modelos máis óptimos, tanto a nivel de calidade como de custo computacional.

Contribucións e futuro

Os achados deste estudo ofrecen orientacións prácticas para os tres pares de linguas e pretenden ser unha guía tanto para o ámbito da investigación como para o empresarial. Para ver os modelos avaliados, os mellor valorados ou consultar máis información sobre os outros factores de avaliación, descargue a guía cubrindo o formulario que atopará ao final da páxina.

La traducción automática (TA) es una herramienta esencial para mejorar la comunicación entre lenguas, especialmente para aquellas con menor presencia digital, como el gallego. En imaxin, con más de 25 años de experiencia en el desarrollo de soluciones lingüísticas, mantenemos un compromiso constante con la innovación en traducción automática. La rápida evolución de la inteligencia artificial hace imprescindible conocer y evaluar los recursos más avanzados disponibles, tanto para la traducción automática como para otras áreas del procesamiento del lenguaje natural (PLN).

Recientemente, en colaboración con la Universidad del País Vasco (EHU), nuestra compañera Sofía García realizó una investigación dentro de su tesis industrial, centrada en identificar los sistemas de traducción automática más efectivos para el gallego. Este estudio, adaptado a las necesidades de una pequeña y mediana empresa (pyme), representa la evaluación más exhaustiva realizada hasta el momento en la traducción automática para el gallego, además del primer estudio en TA que incluye el portugués-gallego dentro de una evaluación genérica. Los resultados de este análisis fueron presentados el pasado 25 de septiembre en el congreso anual de la Sociedad Española del Procesamiento del Lenguaje Natural (SEPLN) 2025, celebrado en Zaragoza.

En este congreso, reconocido como un evento de referencia en tecnologías del lenguaje en el ámbito hispano, tuvimos la oportunidad de conectar con empresas e instituciones del PLN tanto a nivel estatal como internacional. Este encuentro facilitó el intercambio de conocimientos y la creación de lazos tanto académicos como empresariales. Además, escuchamos intervenciones de figuras destacadas en el sector, como Marta R. Costa-jussà, investigadora científica en META, así como de otros expertos de diversas disciplinas, lo que nos permitió ampliar nuestra perspectiva e identificar nuevas oportunidades para innovar dentro de nuestra empresa.

Objetivo del estudio

El estudio tenía como objetivo identificar los modelos de traducción automática de licencia libre más efectivos para los pares de lenguas inglés‑gallego, español‑gallego y portugués‑gallego en el dominio general. Entre los tres pares, se evaluaron un total de 45 sistemas en 23 tests de evaluación teniendo en cuenta tres factores principales:

- Calidad del modelo: precisión de las traducciones producidas
- Varianza en el rendimiento: consistencia de los modelos en distintos datasets de evaluación
- Tamaño del modelo: eficiencia computacional en el contexto de una pyme

Metodología

La investigación evaluó cuatro tipos principales de sistemas de traducción automática:

- Sistemas basados en reglas: Apertium. Para esta evaluación no se utilizó la versión liberada, sino el sistema de pago de nuestra plataforma Opentrad, también implantado en Gaio, el sistema de traducción automática oficial de la Xunta de Galicia.
- Modelos neuronales bilingües: sistemas sequence-to-sequence especializados en un par de lenguas.
- Modelos neuronales multilingües: sistemas sequence-to-sequence que incluyen múltiples lenguas simultáneamente.
- Grandes modelos de lenguaje (LLM): tanto no instruidos, como Llama-3.1.-Carballo; instruidos, como los modelos de EuroLLM; o ajustados para traducción automática, como los modelos de LlaMAX.

Principales resultados

- Español-gallego: donde los más pequeños aún compiten
  Para el par español-gallego, el sistema Opentrad y el modelo neuronal bilingüe del Proxecto Nós siguen siendo competitivos con los modelos multilingües y los LLM. Esto demuestra que entre lenguas próximas y de pocos recursos, los sistemas más pequeños aún pueden funcionar. De manera que, además de dar buenos resultados, ahorran costes económicos y computacionales y son una alternativa menos contaminante que modelos más grandes.
- Inglés-gallego: la fuerza de los modelos multilingües
  Para el par inglés-gallego, los modelos multilingües como madlad demostraron una calidad superior, aprovechando el conocimiento que tienen de distintas lenguas de muchos recursos (high resource languages, HRL) para hacer transferencia de conocimientos a las lenguas con menos recursos (low resource languages, LRL).
- Portugués-gallego: un campo por explorar
  El par portugués-gallego dio unos resultados sorprendentemente bajos en cuanto a métricas. A pesar de ser dos lenguas muy próximas, los resultados cayeron por debajo del inglés-gallego de media. Esto llama la atención, ya que normalmente los pares de lenguas próximas obtienen mejores resultados que los pares de lenguas más distantes.
  Uno de los posibles motivos fue la escasez de tests de evaluación. Para portugués-gallego solo existen tests de referencia multilingües y de dominio genérico, conocidos como benchmarks, la mayoría con las variantes europea y brasileña mezcladas. Por esta razón, consideramos los resultados inconclusos. Urge la creación de buenos tests de evaluación en este par de lenguas, tanto de dominio genérico como específico y que permitan evaluar propiamente la variante europea del portugués, por ser esta de gran interés dada la cercanía lingüística y geográfica entre el gallego y el portugués europeo.
  Ciñéndonos propiamente a la evaluación hecha en el artículo, el modelo nllb-muele-54b, uno de los modelos multilingües más pesados, fue el que obtuvo mejores resultados en cuanto a las métricas de evaluación de la calidad. Aun así, reiteramos la necesidad de investigar este par con más profundidad para conseguir modelos más excelentes, tanto a nivel de calidad como de coste computacional.

Contribuciones y futuro

Los hallazgos de este estudio ofrecen orientaciones prácticas para los tres pares de lenguas y pretenden ser una guía tanto para el ámbito de la investigación como para el empresarial. Para ver los modelos evaluados, los mejor valorados o consultar más información sobre los otros factores de evaluación, descargue la guía cubriendo el formulario que encontrará al final de la página.

Compromiso con las lenguas minorizadas

En imaxin buscamos darlle sempre a mellor calidade aos nosos clientes e, hoxe en día, no ámbito da intelixencia artificial, isto non sería posible se non fósemos da man da investigación. Este último traballo únese a outros focalizados no galego e noutras linguas minorizadas como:

- BLARK, ferramenta para avaliar o estado das linguas minorizadas na intelixencia artificial en canto aos seus recursos. Esta ferramenta desenvolveuse xunto ao Proxecto Nós no European Language Equality do 2023.
- Primeiro modelo neuronal galego-portugués: modelo desenvolvido para o PROPOR 2024, congreso do que fomos patrocinadores. (https://imaxin.com/blog/imaxinsoftware-e-un-dos-patrocinadores-do-congreso-propor24-que-se-celebra-por-primeira-vez-en-galicia/)
- Sistema español-asturiano presentado na Shared Task do WMT24: Translation into Low-Resource Languages of Spain (Tradución ás linguas de poucos recursos de España).

Esta investigación destaca a importancia de desenvolver solucións específicas para linguas como o galego, sen depender exclusivamente de plataformas xerais. Ademais, reforza o papel da colaboración entre empresa e universidade para abordar retos tecnolóxicos complexos. Grazas a estes resultados, temos un coñecemento máis profundo dos recursos dispoñibles e do camiño a seguir para mellorar os sistemas de tradución automática que temos implantados.

Formulario de descarga

Aviso legal

RESPONSABLE: FACTORÍA DE SOFTWARE E MULTIMEDIA, S.L.

FINALIDADE DO TRATAMENTO E LEXITIMACIÓN: Responder á solicitude ou consulta da persoa interesada e no seu caso, enviarlle información relacionada sobre os servizos de imaxin|software, contando co seu consentimento.

DESTINATARIOS: No se cederán datos a terceiros.

EXERCICIO DE DEREITOS: Permítese o exercicio dos dereitos de acceso, rectificación ou supresión, a limitación do tratamento, oposición e o dereito á portabilidade dos seus datos. Tamén poderá revogar o seu consentimento en calquera momento en Salgueiriños de abaixo 11 Local 6 15703, Santiago de Compostela (A Coruña) ou enviando un correo electrónico a lopd@imaxin.com

INFORMACIÓN ADICIONAL: Poderá obter toda a información detallada na nosa Política de Privacidade

Avaliación de sistemas de tradución ao galego, rendemento e variabilidade