{"id":3761,"date":"2025-11-14T09:34:12","date_gmt":"2025-11-14T08:34:12","guid":{"rendered":"https:\/\/imaxin.com\/?p=3761"},"modified":"2025-11-14T09:35:12","modified_gmt":"2025-11-14T08:35:12","slug":"plataina-una-plataforma-para-evaluar-y-mejorar-los-modelos-de-traduccion-automatica-del-bsc","status":"publish","type":"post","link":"https:\/\/imaxin.com\/gl\/blog\/plataina-una-plataforma-para-evaluar-y-mejorar-los-modelos-de-traduccion-automatica-del-bsc\/","title":{"rendered":"PlatAina: unha plataforma para avaliar e mellorar os modelos de traduci\u00f3n autom\u00e1tica do BSC"},"content":{"rendered":"<p>[et_pb_section fb_built=&#8221;1&#8243; _builder_version=&#8221;4.19.1&#8243; _module_preset=&#8221;default&#8221; min_height=&#8221;860.3px&#8221; custom_margin=&#8221;||10px||false|false&#8221; custom_padding=&#8221;21px||0px|||&#8221; global_colors_info=&#8221;{}&#8221;][et_pb_row _builder_version=&#8221;4.19.1&#8243; _module_preset=&#8221;default&#8221; min_height=&#8221;479.7px&#8221; global_colors_info=&#8221;{}&#8221;][et_pb_column type=&#8221;4_4&#8243; _builder_version=&#8221;4.19.1&#8243; _module_preset=&#8221;default&#8221; global_colors_info=&#8221;{}&#8221;][et_pb_text _builder_version=&#8221;4.19.1&#8243; _module_preset=&#8221;default&#8221; text_font=&#8221;Arial||||||||&#8221; hover_enabled=&#8221;0&#8243; global_colors_info=&#8221;{}&#8221; sticky_enabled=&#8221;0&#8243;]<\/p>\n<p><strong>imaxin<\/strong> foi adxudicataria de <strong>dous proxectos do Barcelona Supercomputing Center (BSC)<\/strong> dentro do <strong>AINA Challenge<\/strong>, unha iniciativa destinada a fomentar o uso do catal\u00e1n no \u00e1mbito da intelixencia artificial e o procesamento da linguaxe natural.<\/p>\n<p>Un deles \u00e9 <strong>PlatAina<\/strong>, un proxecto orientado a crear unha plataforma que facilitar\u00e1 a experimentaci\u00f3n e a avaliaci\u00f3n dos modelos ling\u00fc\u00edsticos do Aina Kit. C\u00f3mpre destacar que <strong>PlatAina foi o proxecto con maior puntuaci\u00f3n de todos os presentados ao concurso<\/strong>.<\/p>\n<h3>Un contorno de avaliaci\u00f3n colaborativo<\/h3>\n<p>O obxectivo de PlatAina \u00e9 dotar o BSC dunha plataforma en li\u00f1a desde a cal poida<strong> probar e comparar distintos modelos de traduci\u00f3n<\/strong> e, ao mesmo tempo, recoller datos de avaliaci\u00f3n cualitativa e cuantitativa baseados na interacci\u00f3n coas persoas usuarias.<br \/>Deste xeito, o sistema non s\u00f3 permite traducir textos e documentos, sen\u00f3n tam\u00e9n <strong>obter retroalimentaci\u00f3n directa que contrib\u00faa \u00e1 mellora dos modelos neuronais e LLM<\/strong> utilizados.<\/p>\n<p>A trav\u00e9s da plataforma, poderanse realizar dous tipos de operaci\u00f3ns principais:<\/p>\n<ul>\n<li><strong>Traduci\u00f3n de textos<\/strong>: as persoas usuarias poder\u00e1n seleccionar o par de idiomas e o modelo de traduci\u00f3n, e avaliar o resultado respondendo a tres preguntas: decidir se a traduci\u00f3n \u00e9 correcta ou incorrecta, identificar o tipo de erro se o houbese, propo\u00f1er unha versi\u00f3n alternativa e engadir comentarios opcionais. Estas achegas son unha fonte de informaci\u00f3n clave para o BSC, xa que axudan a identificar padr\u00f3ns de erro e a orientar a optimizaci\u00f3n dos modelos.<\/li>\n<li><strong>Traduci\u00f3n de documentos<\/strong>: permite traducir ficheiros en distintos formatos (como DOCX ou HTML) conservando a s\u00faa estrutura orixinal. Neste caso, a persoa usuaria pode editar a traduci\u00f3n nunha ferramenta CAT (Computer-Assisted Translation) integrada, que mostra os segmentos orixinais e os traducidos para detectar erros com\u00fans en modelos neuronais, como alucinaci\u00f3ns ou omisi\u00f3ns, e para validar manualmente o resultado final.<\/li>\n<\/ul>\n<p>M\u00e1is al\u00f3 da s\u00faa utilidade directa, PlatAina ten un papel estrat\u00e9xico:<strong> avaliar o rendemento dos modelos neuronais e de linguaxe (LLM)<\/strong> que, a\u00ednda que ofrecen traduci\u00f3ns m\u00e1is naturais e precisas, presentan desaf\u00edos na detecci\u00f3n de erros dif\u00edciles de percibir, como omisi\u00f3ns ou alucinaci\u00f3ns. Por iso, esta plataforma resulta esencial para <strong>afondar na s\u00faa an\u00e1lise, mellorar o seu comportamento e fortalecer a calidade ling\u00fc\u00edstica do ecosistema AINA<\/strong>.<\/p>\n<h3>Arquitectura de PlatAina: optimizaci\u00f3n, autoaloxamento e orquestraci\u00f3n avanzada<\/h3>\n<p>No competitivo \u00e1mbito da traduci\u00f3n autom\u00e1tica, a arquitectura de sistemas \u00e9 un factor decisivo para garantir a escalabilidade, a eficiencia e a robustez. PlatAina destaca polo seu dese\u00f1o t\u00e9cnico, centrado na optimizaci\u00f3n de recursos, o autoaloxamento dos modelos e a xesti\u00f3n intelixente de procesos mediante <strong>tecnolox\u00edas de orquestraci\u00f3n destacadas como Temporal.io<\/strong>.<\/p>\n<h4>Arquitectura modular e microservizos<\/h4>\n<p>PlatAina bas\u00e9ase nunha arquitectura de microservizos, onde cada compo\u00f1ente cumpre unha funci\u00f3n espec\u00edfica e se comunica a trav\u00e9s de API. O sistema componse dos seguintes elementos principais:<\/p>\n<ul>\n<li><strong>API Gateway<\/strong>: punto de entrada \u00fanico para todas as solicitudes externas, que facilita a xesti\u00f3n e a seguridade.<\/li>\n<li><strong>Sistema de colas<\/strong>: xestiona as petici\u00f3ns de traduci\u00f3n de forma as\u00edncrona, desacoplando a recepci\u00f3n de solicitudes do procesamento.<\/li>\n<li><strong>TranslatorEngine<\/strong>: microservizo encargado de executar as traduci\u00f3ns, integrando os modelos ling\u00fc\u00edsticos autoaloxados.<\/li>\n<li><strong>Deformater e Alignment<\/strong>: servizos dedicados a extraer e reconstru\u00edr o formato orixinal dos documentos, garantindo que o contido traducido conserve a s\u00faa estrutura.<\/li>\n<li><strong>Sistema de persistencia<\/strong>: almacenamento de obxectos compatible con Amazon S3, empregado para gardar documentos e datos de uso.<\/li>\n<\/ul>\n<p>Esta arquitectura modular permite<strong> escalar cada compo\u00f1ente de forma independente<\/strong>, optimizando o rendemento e facilitando o mantemento e a evoluci\u00f3n do sistema.<\/p>\n<h4>Modelos autoaloxados: control e eficiencia<\/h4>\n<p>Unha das principais vantaxes de PlatAina \u00e9 que <strong>todos os modelos de traduci\u00f3n se executan na infraestrutura propia<\/strong>, sen depender de servizos externos. Isto ofrece beneficios significativos:<\/p>\n<ul>\n<li><strong>Privacidade e control de datos<\/strong>, xa que os documentos e textos nunca saen do contorno do BSC, cumprindo cos m\u00e1is altos requisitos de seguridade e confidencialidade no tratamento da informaci\u00f3n.<\/li>\n<li><strong>Optimizaci\u00f3n de recursos<\/strong>, grazas \u00e1 capacidade do sistema para axustar dinamicamente a despregadura dos modelos segundo a demanda real, evitando o sobredimensionamento, reducindo os custos operativos e mellorando a eficiencia xeral do contorno.<\/li>\n<li><strong>Flexibilidade e independencia tecnol\u00f3xica<\/strong>, que permite integrar novos modelos ou actualizar os existentes sen depender de provedores externos nin introducir cambios estruturais na plataforma, garantindo as\u00ed a s\u00faa evoluci\u00f3n continua e a s\u00faa autonom\u00eda tecnol\u00f3xica.<\/li>\n<\/ul>\n<h4>Orquestraci\u00f3n con Temporal.io: automatizaci\u00f3n e resiliencia<\/h4>\n<p>Plataina utiliza Temporal.io como orquestrador de fluxos de traballo. Temporal.io \u00e9 unha plataforma open source que permite definir, executar e monitorizar procesos complexos de maneira fiable e escalable. Isto achega beneficios clave:<\/p>\n<ul>\n<li><strong>Xesti\u00f3n de procesos distribu\u00eddos<\/strong>, xa que Temporal.io coordina a execuci\u00f3n de tarefas entre distintos microservizos, asegurando que cada paso do proceso de traduci\u00f3n \u2014extracci\u00f3n, traduci\u00f3n, ali\u00f1amento e almacenamento\u2014 se realice na orde correcta, con control de dependencias e tolerancia a fallos.<\/li>\n<li><strong>Automatizaci\u00f3n avanzada<\/strong>, que permite definir fluxos de traballo din\u00e1micos e adaptativos segundo as necesidades do sistema, incorporando funci\u00f3ns de priorizaci\u00f3n de tarefas, reintentos autom\u00e1ticos en caso de erro e unha monitorizaci\u00f3n centralizada que facilita a supervisi\u00f3n e a trazabilidade de cada proceso.<\/li>\n<li><strong>Escalabilidade e resiliencia<\/strong>, posto que Temporal.io habilita a escalabilidade horizontal do sistema, permitindo procesar grandes volumes de documentos sen comprometer a estabilidade. A s\u00faa arquitectura tolerante a fallos garante a continuidade do servizo mesmo ante incidencias nos microservizos subxacentes, asegurando un funcionamento robusto e sostido.<\/li>\n<\/ul>\n<h3>Contribu\u00edndo ao ecosistema ling\u00fc\u00edstico e tecnol\u00f3xico<\/h3>\n<p>PlatAina al\u00ed\u00f1ase plenamente cos obxectivos estrat\u00e9xicos do <strong>proxecto Aina<\/strong>, que busca <strong>situar Catalu\u00f1a como referente no \u00e1mbito da intelixencia artificial e da tecnolox\u00eda ling\u00fc\u00edstica<\/strong>, fomentando a adopci\u00f3n de recursos abertos nos sectores p\u00fablico e privado.<\/p>\n<p>Desde <strong>imaxin<\/strong>, compartimos esa visi\u00f3n: <strong>impulsar tecnolox\u00edas responsables, abertas e orientadas ao ben com\u00fan<\/strong>, que fortalezan o ecosistema dixital das linguas cooficiais e faciliten a s\u00faa presenza nos contornos tecnol\u00f3xicos m\u00e1is avanzados.<\/p>\n<p>Con proxectos como PlatAina e Curritext, reafirmamos o noso compromiso cunha intelixencia artificial m\u00e1is inclusiva, transparente e adaptada \u00e1 diversidade ling\u00fc\u00edstica do territorio.<\/p>\n<p>&nbsp;<\/p>\n<p>Se atopaches PlatAina interesante, <strong>hai m\u00e1is<\/strong>.<\/p>\n<p>En <strong>imaxin<\/strong> seguimos impulsando tecnolox\u00edas ling\u00fc\u00edsticas que axudan a que o mundo se entenda mellor.<\/p>\n<ul>\n<li>Descubre como traballamos a <span style=\"text-decoration: underline;\"><a href=\"https:\/\/imaxin.com\/gl\/imaxincontext\/\">traduci\u00f3n autom\u00e1tica<\/a><\/span><\/li>\n<li>Continuemos o di\u00e1logo nunha <span style=\"text-decoration: underline;\"><a href=\"https:\/\/imaxin.com\/gl\/contacto\/\">reuni\u00f3n<\/a><\/span><\/li>\n<\/ul>\n<p>[\/et_pb_text][\/et_pb_column][\/et_pb_row][\/et_pb_section]<\/p>\n","protected":false},"excerpt":{"rendered":"<p>imaxin foi adxudicataria de dous proxectos do Barcelona Supercomputing Center (BSC) dentro do AINA Challenge, unha iniciativa destinada a fomentar o uso do catal\u00e1n no \u00e1mbito da intelixencia artificial e o procesamento da linguaxe natural. Un deles \u00e9 PlatAina, un proxecto orientado a crear unha plataforma que facilitar\u00e1 a experimentaci\u00f3n e a avaliaci\u00f3n dos modelos [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":3780,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"on","_et_pb_old_content":"","_et_gb_content_width":""},"categories":[91,19,90,21],"tags":[],"_links":{"self":[{"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/posts\/3761"}],"collection":[{"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/comments?post=3761"}],"version-history":[{"count":3,"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/posts\/3761\/revisions"}],"predecessor-version":[{"id":3771,"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/posts\/3761\/revisions\/3771"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/media\/3780"}],"wp:attachment":[{"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/media?parent=3761"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/categories?post=3761"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/imaxin.com\/gl\/wp-json\/wp\/v2\/tags?post=3761"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}