Ficha
Estado: Proyecto subvencionado finalizado. El sistema continúa en evolución como línea activa de mejora y maduración tecnológica.
Duración: 11 meses. Primera anualidad del 11/02/2025 al 31/10/2025 y segunda anualidad del 01/11/2025 al 09/01/2026.
Programa de financiación: Convocatoria IA360 del Igape, en el marco del Plan de Recuperación, Transformación y Resiliencia, financiado por la Unión Europea – NextGenerationEU. La operación se cofinancia en un 25 % con fondos propios de la Comunidad Autónoma de Galicia y en un 75 % con fondos del Mecanismo de Recuperación y Resiliencia.
Expediente: IG408M-2025-000-000133.
Entidades participantes: imaxin.
Landing del producto: Lynx
Resumen
Lynx es un proyecto de I+D+i desarrollado por imaxin para crear una plataforma inteligente de recuperación y generación aumentada de información, orientada a contextos en los que la consulta documental es compleja y la fiabilidad de la respuesta resulta crítica. Su primer caso de aplicación se centró en la consulta del Diario Oficial de Galicia y otros boletines oficiales mediante lenguaje natural, combinando recuperación semántica, búsqueda documental y modelos de lenguaje para ofrecer respuestas contextualizadas y basadas en fuentes verificadas.
En este marco, imaxin desarrolló una arquitectura RAG especializada que permite transformar documentación extensa, técnica y dispersa en una experiencia de consulta más accesible, trazable y útil para la ciudadanía, administración pública, medios de comunicación y otros entornos con grandes volúmenes de información no estructurada.
El reto
Uno de los problemas más frecuentes en la transformación digital no está solo en disponer de información, sino en conseguir que esa información pueda encontrarse, comprenderse y utilizarse con facilidad. En el ámbito jurídico-administrativo, la documentación publicada en boletines oficiales suele ser extensa, técnica y dependiente de un contexto normativo que no siempre resulta evidente para quienes la consultan.
Lynx se planteó precisamente para responder a esa dificultad. El proyecto partía de una necesidad clara: permitir que una persona pudiese formular una pregunta en lenguaje natural y obtener una respuesta fundamentada a partir de documentos oficiales, sin depender exclusivamente de búsquedas manuales, terminología exacta o conocimiento previo sobre la estructura del boletín. A partir del análisis inicial, se identificaron casos de uso especialmente relevantes, como consultas sobre subvenciones y ayudas públicas, requisitos de trámites, acceso a normativa vigente, plazos, documentación, formularios y servicios públicos.

La aportación de imaxin
La aportación de imaxin en Lynx se centró en el diseño y desarrollo de una plataforma RAG multilingüe capaz de combinar recuperación de información, generación de respuestas, trazabilidad documental, seguridad y evaluación continua en un mismo sistema. El trabajo abarcó desde el análisis de requisitos y definición de casos de uso hasta la construcción de la arquitectura, la selección tecnológica, la implementación del sistema de consulta y su posterior validación y evolución.
El proyecto permitió trasladar a un caso real capacidades clave de imaxin en tecnologías del lenguaje, IA aplicada y procesamiento documental, explorando cómo adaptar arquitecturas RAG a un contexto especialmente exigente: documentación legal, fuentes oficiales, necesidad de verificabilidad y soporte a consultas en lenguas cooficiales.
Qué se desarrolló
Lynx se articuló como una plataforma de consulta inteligente basada en varias capas de procesamiento. En primer lugar, se diseñó un sistema de captura y actualización automática de contenidos, con scraping diario del DOG y preparación de los documentos para su explotación posterior. A continuación, se desarrolló la infraestructura de almacenamiento e indexación, separando la búsqueda textual y la búsqueda semántica para mejorar la cobertura y la precisión de las respuestas.
Sobre esa base se construyó el motor de consulta, que permite tratar la pregunta de la persona usuaria, recuperar los fragmentos más relevantes, reordenarlos en función de su pertinencia y generar finalmente una respuesta contextualizada. El sistema se completó con una interfaz conversacional, mecanismos de seguimiento de consultas, evaluación de respuestas y recogida de feedback para la mejora continua.
Tecnología y enfoque
Desde el punto de vista tecnológico, Lynx combina una arquitectura RAG con recuperación híbrida, uniendo búsqueda semántica y búsqueda por palabras clave para aprovechar las fortalezas de ambos enfoques. Los documentos se fragmentan e indexan en una base vectorial para recuperación por similitud, mientras que los textos completos y sus metadatos se gestionan en un motor documental que facilita búsquedas léxicas y estructuradas. Después, ambos resultados se fusionan y pasan por un proceso de reranking antes de llegar al modelo generativo.

Para este desarrollo se trabajó con tecnologías como Apache Airflow para la orquestación ETL, Elasticsearch para la indexación documental, Qdrant como base de datos vectorial y una solución basada en Chainlit y LangChain para la capa de interacción y control del sistema. Durante el proyecto, se descartó Flowise por sus limitaciones para gestionar con suficiente precisión la segmentación, el control de los fragmentos y la personalización de los flujos RAG.
Uno de los aspectos más relevantes del enfoque fue su adaptación al dominio legal y al contexto lingüístico gallego. La arquitectura tuvo en cuenta cuestiones como el tratamiento multilingüe de las consultas, la protección frente a usos indebidos, la detección de datos sensibles y la necesidad de mantener una relación clara entre cada respuesta y su fuente documental.
Validación, piloto y mejoras
La validación ocupó un papel central en el proyecto. En la segunda anualidad se trabajó en la medición de la calidad de las respuestas y en el ajuste fino del sistema a partir de un dataset de evaluación desarrollado con apoyo del CiTIUS. Esta fase permitió convertir la validación en una pieza estructural de la plataforma, no solo como control final, sino como mecanismo para detectar deficiencias, revisar decisiones de arquitectura y mejorar progresivamente la fiabilidad del sistema.
Además, se desplegó una prueba piloto en un entorno de preproducción con acceso a posibles clientes, con el objetivo de observar el funcionamiento del sistema en un escenario real de uso y recoger información útil antes de una posible adopción más amplia. Paralelamente, se incorporaron herramientas de seguimiento del pipeline completo, desde la transformación de la consulta hasta la recuperación, el reranking y la generación final de la respuesta.
Resultados
El proyecto permitió completar el diseño y desarrollo de una plataforma funcional para la consulta de información pública mediante lenguaje natural, con una arquitectura modular, una base documental operativa, un sistema RAG especializado y una capa de evaluación y seguimiento orientada a la mejora continua. También hizo posible validar la viabilidad de este enfoque en un dominio especialmente exigente, donde la precisión, la trazabilidad y la claridad de la respuesta son esenciales.
Además de los resultados técnicos, Lynx permitió consolidar una base de conocimiento reutilizable para nuevas aplicaciones relacionadas con recuperación documental, asistentes inteligentes, búsqueda semántica e IA aplicada a información estructurada y especializada. Como parte de la transferencia del proyecto, imaxin publicó también un repositorio abierto con componentes y ejemplos relacionados con el pipeline RAG desarrollado.
Impacto
Lynx ha permitido a imaxin avanzar en una línea de I+D+i centrada en el acceso inteligente a la información, combinando tecnologías del lenguaje, recuperación documental e inteligencia artificial aplicada. El proyecto muestra cómo una arquitectura RAG bien diseñada puede resultar útil no solo en información pública, sino también en otros contextos donde existen grandes volúmenes de documentación, necesidad de respuestas fundamentadas y exigencia de control sobre las fuentes.
Más allá del caso concreto del DOG, Lynx refuerza la capacidad de imaxin para abordar proyectos en ámbitos como asistentes documentales, consulta sobre bases de conocimiento, automatización del acceso a normativa, IA con fuentes verificadas, recuperación semántica y tecnologías aplicadas a lenguas cooficiales. La continuidad del sistema tras la fase subvencionada confirma, además, que se trata de una línea tecnológica con recorrido y no de una iniciativa aislada.
Financiación
Proyecto financiado en el marco de la convocatoria IA360 del Instituto Galego de Promoción Económica (Igape), dentro del Plan de Recuperación, Transformación y Resiliencia, financiado por la Unión Europea – NextGenerationEU. La operación se cofinancia en un 25 % mediante fondos propios de la comunidad autónoma de Galicia y en un 75 % con fondos del Mecanismo de Recuperación y Resiliencia. Expediente IG408M-2025-000-000133.
¿Tienes un proyecto?
Pídenos presupuesto sin compromiso.