Ficha
Estado: Proxecto subvencionado finalizado. O sistema continúa en evolución como liña activa de mellora e maduración tecnolóxica.
Duración: 11 meses. Primeira anualidade do 11/02/2025 ao 31/10/2025 e segunda anualidade do 01/11/2025 ao 09/01/2026.
Programa de financiamento: Convocatoria IA360 do Igape, no marco do Plan de recuperación, transformación e resiliencia, financiado pola Unión Europea – NextGenerationEU. A operación cofinánciase nun 25 % con fondos propios da Comunidade Autónoma de Galicia e nun 75 % con fondos do Mecanismo de recuperación e resiliencia.
Expediente: IG408M-2025-000-000133.
Entidades participantes: imaxin.
Páxina do produto: Lynx
Resumo
LYNX é un proxecto de I+D+i desenvolvido por imaxin para crear unha plataforma intelixente de recuperación e xeración aumentada de información, orientada a contextos nos que a consulta documental é complexa e a fiabilidade da resposta resulta crítica. O seu primeiro caso de aplicación centrouse na consulta do Diario Oficial de Galicia e outros boletíns oficiais mediante linguaxe natural, combinando recuperación semántica, busca documental e modelos de linguaxe para ofrecer respostas contextualizadas e baseadas en fontes verificadas.
Neste marco, imaxin desenvolveu unha arquitectura RAG especializada que permite transformar documentación extensa, técnica e dispersa nunha experiencia de consulta máis accesible, rastrexable e útil para a cidadanía, a administración pública, os medios de comunicación e outros ámbitos con grandes volumes de información non estruturada.
O reto
Un dos problemas máis frecuentes na transformación dixital non está só en dispoñer de información, senón en conseguir que esa información poida encontrarse, comprenderse e utilizarse con facilidade. No ámbito xurídico-administrativo, a documentación publicada en boletíns oficiais adoita ser extensa, técnica e dependente dun contexto normativo que non sempre resulta evidente para quen a consulta.
LYNX formulouse precisamente para responder a esa dificultade. O proxecto partía dunha necesidade clara: permitir que unha persoa puidese formular unha pregunta en linguaxe natural e obter unha resposta fundamentada a partir de documentos oficiais, sen depender exclusivamente de buscas manuais, terminoloxía exacta ou coñecemento previo sobre a estrutura do boletín. A partir da análise inicial, identificáronse casos de uso especialmente relevantes, como consultas sobre subvencións e axudas públicas, requisitos de trámites, acceso á normativa vixente, prazos, documentación, formularios e servizos públicos.

A achega de imaxin
A achega de imaxin en LYNX centrouse no deseño e desenvolvemento dunha plataforma RAG multilingüe capaz de combinar recuperación de información, xeración de respostas, rastrexabilidade documental, seguridade e avaliación continua nun mesmo sistema. O traballo abarcou desde a análise de requisitos e a definición de casos de uso ata a construción da arquitectura, a selección tecnolóxica, a implementación do sistema de consulta e a súa posterior validación e evolución.
O proxecto permitiu trasladar a un caso real capacidades clave de imaxin en tecnoloxías da linguaxe, IA aplicada e procesamento documental, explorando como adaptar arquitecturas RAG a un contexto especialmente esixente: documentación legal, fontes oficiais, necesidade de verificabilidade e soporte a consultas en linguas cooficiais.
Que se desenvolveu
LYNX articulouse como unha plataforma de consulta intelixente baseada en varias capas de procesamento. En primeiro lugar, deseñouse un sistema de captura e actualización automática de contidos, con scraping diario do DOG e preparación dos documentos para a súa explotación posterior. A continuación, desenvolveuse a infraestrutura de almacenamento e indexación, separando a busca textual e a busca semántica para mellorar a cobertura e a precisión das respostas.
Sobre esa base construíuse o motor de consulta, que permite tratar a pregunta da persoa usuaria, recuperar os fragmentos máis relevantes, reordenalos en función da súa pertinencia e xerar finalmente unha resposta contextualizada. O sistema completouse cunha interface conversacional, mecanismos de seguimento de consultas, avaliación de respostas e recollida de feedback para a mellora continua.
Tecnoloxía e enfoque
Desde o punto de vista tecnolóxico, LYNX combina unha arquitectura RAG con recuperación híbrida, unindo busca semántica e busca por palabras clave para aproveitar as fortalezas de ambos os enfoques. Os documentos fragméntanse e indéxanse nunha base vectorial para recuperación por similitude, mentres que os textos completos e os seus metadatos xestiónanse nun motor documental que facilita buscas léxicas e estruturadas. Despois, ambos os resultados fusiónanse e pasan por un proceso de reranking antes de chegar ao modelo xerativo.

Para este desenvolvemento traballouse con tecnoloxías como Apache Airflow para a orquestación ETL, Elasticsearch para a indexación documental, Qdrant como base de datos vectorial e unha solución baseada en Chainlit e LangChain para a capa de interacción e control do sistema. Durante o proxecto, descartouse Flowise polas súas limitacións para xestionar con suficiente precisión a segmentación, o control dos fragmentos e a personalización dos fluxos RAG.
Un dos aspectos máis relevantes do enfoque foi a súa adaptación ao dominio legal e ao contexto lingüístico galego. A arquitectura tivo en conta cuestións como o tratamento multilingüe das consultas, a protección fronte a usos indebidos, a detección de datos sensibles e a necesidade de manter unha relación clara entre cada resposta e a súa fonte documental.
Validación, piloto e melloras
A validación ocupou un papel central no proxecto. Na segunda anualidade traballouse na medición da calidade das respostas e no axuste fino do sistema a partir dun dataset de avaliación desenvolvido co apoio do CiTIUS. Esta fase permitiu converter a validación nunha peza estrutural da plataforma, non só como control final, senón como mecanismo para detectar deficiencias, revisar decisións de arquitectura e mellorar progresivamente a fiabilidade do sistema.
Ademais, despregouse unha proba piloto nun contorno de preprodución con acceso a posibles clientes, co obxectivo de observar o funcionamento do sistema nun escenario real de uso e recoller información útil antes dunha posible adopción máis ampla. Paralelamente, incorporáronse ferramentas de seguimento do pipeline completo, desde a transformación da consulta ata a recuperación, o reranking e a xeración final da resposta.
Resultados
O proxecto permitiu completar o deseño e o desenvolvemento dunha plataforma funcional para a consulta de información pública mediante linguaxe natural, cunha arquitectura modular, unha base documental operativa, un sistema RAG especializado e unha capa de avaliación e seguimento orientada á mellora continua. Tamén fixo posible validar a viabilidade deste enfoque nun dominio especialmente esixente, onde a precisión, a rastrexabilidade e a clareza da resposta son esenciais.
Ademais dos resultados técnicos, LYNX permitiu consolidar unha base de coñecemento reutilizable para novas aplicacións relacionadas con recuperación documental, asistentes intelixentes, busca semántica e IA aplicada a información estruturada e especializada. Como parte da transferencia do proxecto, imaxin publicou tamén un repositorio aberto con compoñentes e exemplos relacionados co pipeline RAG desenvolvido.
Impacto
LYNX permitiu a imaxin avanzar nunha liña de I+D+i centrada no acceso intelixente á información, combinando tecnoloxías da linguaxe, recuperación documental e intelixencia artificial aplicada. O proxecto mostra como unha arquitectura RAG ben deseñada pode resultar útil non só en información pública, senón tamén noutros contextos onde existen grandes volumes de documentación, necesidade de respostas fundamentadas e esixencia de control sobre as fontes.
Máis aló do caso concreto do DOG, LYNX reforza a capacidade de imaxin para abordar proxectos en ámbitos como asistentes documentais, consulta sobre bases de coñecemento, automatización do acceso á normativa, IA con fontes verificadas, recuperación semántica e tecnoloxías aplicadas a linguas cooficiais. A continuidade do sistema tras a fase subvencionada confirma, ademais, que se trata dunha liña tecnolóxica con percorrido e non dunha iniciativa illada.
Financiamento
Proxecto financiado no marco da convocatoria IA360 do Instituto Galego de Promoción Económica (Igape), dentro do Plan de recuperación, transformación e resiliencia, financiado pola Unión Europea – NextGenerationEU. A operación cofinánciase nun 25 % mediante fondos propios da Comunidade Autónoma de Galicia e nun 75 % con fondos do Mecanismo de recuperación e resiliencia. Expediente IG408M-2025-000-000133.
Tes un proxecto?
Pídenos orzamento sen compromiso.