¿Qué es ALIA?

ALIA es la primera infraestructura pública europea de inteligencia artificial en castellano y lenguas cooficiales (catalán, valenciano, euskera y gallego). Es un proyecto pionero que ofrece modelos de lenguaje abiertos y transparentes, financiado con fondos públicos, para reforzar la soberanía tecnológica de España y Europa.

Gracias al superordenador MareNostrum 5 y la coordinación del Barcelona Supercomputing Center, ALIA impulsa una IA responsable, accesible y al servicio de la ciudadanía.

 

 

 

ALIA-CENID

 
 
 

 

 

Logo SINAI

El papel de SINAI en ALIA

El Grupo de Investigación SINAI de la Universidad de Jaén desempeña un papel clave en ALIA, contribuyendo al enriquecimiento del ecosistema con recursos y modelos de lenguaje avanzados en español.

El grupo se centra en la construcción tanto de modelos generativos como de modelos discriminativos (como embeddings), cubriendo tareas diversas como generación de texto, clasificación de documentos o recuperación de información.

 
 

Nuestro objetivo

El objetivo principal es facilitar la creación de una nueva generación de recursos y servicios tecnológicos innovadores, construidos sobre el inmenso patrimonio lingüístico del castellano y de las lenguas cooficiales.

Queremos que la inteligencia artificial desarrollada en España sea inclusiva, transparente y útil para todos los sectores, apostando por una IA confiable, justa y orientada al beneficio colectivo.

 
 

Pública y abierta

ALIA es una infraestructura 100% financiada con fondos públicos, lo que garantiza que su desarrollo y sus resultados estén al servicio del interés general.

Su carácter abierto asegura la máxima transparencia, permitiendo que la comunidad investigadora pueda auditar y mejorar los modelos, que las empresas innoven y que la ciudadanía confíe en herramientas responsables.

 
 
 
 
 

Resultados

 
 
 

A continuación se presentan los datasets, modelos y demostradores desarrollados por el grupo SINAI en el marco del proyecto ALIA.

Tres dominios de trabajo

 
 

Biosanitario

Desarrollo de conjuntos de datos y modelos para mejorar la comprensión y generación de informes clínicos y biomédicos.

 
 

Legal-administrativo

Recursos lingüísticos orientados a trámites, documentos jurídicos y administrativos, facilitando el acceso ciudadano a la información pública.

 
 

Patrimonial-cultural

Modelos diseñados para la preservación, difusión y digitalización del patrimonio histórico y cultural.