imaxin ha sido adjudicataria de dos proyectos del Barcelona Supercomputing Center (BSC) en el marco del AINA Challenge, una iniciativa destinada a fomentar el uso del catalán en el ámbito de la inteligencia artificial y el procesamiento del lenguaje natural.
Uno de ellos es PlatAina, un proyecto orientado a crear una plataforma que facilitará la experimentación y evaluación de los modelos lingüísticos del Aina Kit. Cabe destacar que PlatAina fue el proyecto con mayor puntuación de todos los presentados al concurso.
Un entorno de evaluación colaborativo
El objetivo de PlatAina es dotar al BSC de una plataforma en línea desde la cual pueda probar y comparar distintos modelos de traducción y, al mismo tiempo, recoger datos de evaluación cualitativa y cuantitativa basados en la interacción con las personas usuarias.
De este modo, el sistema no solo permite traducir textos y documentos, sino también obtener retroalimentación directa que contribuya a la mejora de los modelos neuronales y LLM utilizados.
A través de la plataforma, se podrán realizar dos tipos de operaciones principales:
- Traducción de textos: las personas usuarias podrán seleccionar el par de idiomas y el modelo de traducción, y evaluar el resultado respondiendo a tres preguntas: decidir si la traducción es correcta o incorrecta, identificar el tipo de error si lo hubiera, proponer una versión alternativa y añadir comentarios opcionales. Estas aportaciones son una fuente de información clave para el BSC, ya que ayudan a identificar patrones de error y orientar la optimización de los modelos.
- Traducción de documentos: permite traducir ficheros en distintos formatos (como DOCX o HTML) conservando su estructura original. En este caso, la persona usuaria puede editar la traducción en una herramienta CAT (Computer-Assisted Translation) integrada, que muestra los segmentos originales y traducidos para detectar errores comunes en modelos neuronales, como alucinaciones u omisiones, y validar manualmente el resultado final.
Más allá de su utilidad directa, PlatAina tiene un papel estratégico: evaluar el rendimiento de los modelos neuronales y de lenguaje (LLM) que, si bien ofrecen traducciones más naturales y precisas, presentan desafíos en la detección de errores difíciles de percibir como omisiones o alucinaciones. Por ello, esta plataforma resulta esencial para profundizar en su análisis, mejorar su comportamiento y fortalecer la calidad lingüística del ecosistema AINA.
Arquitectura de PlatAina: optimización, autoalojamiento y orquestación avanzada
En el competitivo ámbito de la traducción automática, la arquitectura de sistemas es un factor decisivo para garantizar la escalabilidad, eficiencia y robustez. PlatAina destaca por su diseño técnico, centrado en la optimización de recursos, el autoalojamiento de los modelos y la gestión inteligente de procesos mediante tecnologías de orquestación punteras como Temporal.io.
Arquitectura modular y microservicios
PlatAina se basa en una arquitectura de microservicios, donde cada componente cumple una función específica y se comunica a través de API. El sistema se compone de los siguientes elementos principales:
- API Gateway: punto de entrada único para todas las solicitudes externas, que facilita la gestión y la seguridad.
- Sistema de colas: gestiona las peticiones de traducción de forma asíncrona, desacoplando la recepción de solicitudes del procesamiento.
- TranslatorEngine: microservicio encargado de ejecutar las traducciones, integrando los modelos lingüísticos autoalojados.
- Deformater y Alignment: servicios dedicados a extraer y reconstruir el formato original de los documentos, garantizando que el contenido traducido conserve su estructura.
- Sistema de persistencia: almacenamiento de objetos compatible con Amazon S3, empleado para guardar documentos y datos de uso.
Esta arquitectura modular permite escalar cada componente de forma independiente, optimizando el rendimiento y facilitando el mantenimiento y la evolución del sistema.
Modelos autoalojados: control y eficiencia
Una de las principales ventajas de PlatAina es que todos los modelos de traducción se ejecutan en la infraestructura propia, sin depender de servicios externos. Esto ofrece beneficios significativos:
- Privacidad y control de datos, ya que los documentos y textos nunca salen del entorno del BSC, cumpliendo con los más altos requisitos de seguridad y confidencialidad en el tratamiento de la información.
- Optimización de recursos, gracias a la capacidad del sistema para ajustar dinámicamente el despliegue de los modelos según la demanda real, evitando el sobredimensionamiento, reduciendo los costes operativos y mejorando la eficiencia general del entorno.
- Flexibilidad e independencia tecnológica, que permite integrar nuevos modelos o actualizar los existentes sin depender de proveedores externos ni introducir cambios estructurales en la plataforma, garantizando así su evolución continua y su autonomía tecnológica.
Orquestación con Temporal.io: automatización y resiliencia
Plataina utiliza Temporal.io como orquestador de flujos de trabajo. Temporal.io es una plataforma open source que permite definir, ejecutar y monitorizar procesos complejos de manera fiable y escalable. Esto aporta beneficios clave:
- Gestión de procesos distribuidos, ya que Temporal.io coordina la ejecución de tareas entre distintos microservicios, asegurando que cada paso del proceso de traducción —extracción, traducción, alineamiento y almacenamiento— se realice en el orden correcto, con control de dependencias y tolerancia a fallos.
- Automatización avanzada, que permite definir flujos de trabajo dinámicos y adaptativos según las necesidades del sistema, incorporando funciones de priorización de tareas, reintentos automáticos en caso de error y una monitorización centralizada que facilita la supervisión y trazabilidad de cada proceso.
- Escalabilidad y resiliencia, puesto que Temporal.io habilita la escalabilidad horizontal del sistema, permitiendo procesar grandes volúmenes de documentos sin comprometer la estabilidad. Su arquitectura tolerante a fallos garantiza la continuidad del servicio incluso ante incidencias en los microservicios subyacentes, asegurando un funcionamiento robusto y sostenido.
Contribuyendo al ecosistema lingüístico y tecnológico
PlatAina se alinea plenamente con los objetivos estratégicos del proyecto Aina, que busca posicionar Cataluña como referente en el ámbito de la inteligencia artificial y la tecnología lingüística, fomentando la adopción de recursos abiertos en los sectores público y privado.
Desde imaxin, compartimos esa visión: impulsar tecnologías responsables, abiertas y orientadas al bien común, que fortalezcan el ecosistema digital de las lenguas cooficiales y faciliten su presencia en los entornos tecnológicos más avanzados.
Con proyectos como PlatAina y Curritext, reafirmamos nuestro compromiso con una inteligencia artificial más inclusiva, transparente y adaptada a la diversidad lingüística del territorio.
Si Plataina te resultó interesante, hay más.
En imaxin seguimos impulsando tecnologías lingüísticas que ayudan a que el mundo se entienda mejor.
- Descubre cómo trabajamos la tradución automática
- Continuemos el diálogo en una reunión
