¿Qué es ALIA?ALIA es la primera infraestructura pública europea de inteligencia artificial en castellano y lenguas cooficiales (catalán, valenciano, euskera y gallego). Es un proyecto pionero que ofrece modelos de lenguaje abiertos y transparentes, financiado con fondos públicos, para reforzar la soberanía tecnológica de España y Europa. Gracias al superordenador MareNostrum 5 y la coordinación del Barcelona Supercomputing Center, ALIA impulsa una IA responsable, accesible y al servicio de la ciudadanía. |
|
![]() | El papel de SINAI en ALIAEl Grupo de Investigación SINAI de la Universidad de Jaén desempeña un papel clave en ALIA, contribuyendo al enriquecimiento del ecosistema con recursos y modelos de lenguaje avanzados en español. El grupo se centra en la construcción tanto de modelos generativos como de modelos discriminativos (como embeddings), cubriendo tareas diversas como generación de texto, clasificación de documentos o recuperación de información. |
Nuestro objetivoEl objetivo principal es facilitar la creación de una nueva generación de recursos y servicios tecnológicos innovadores, construidos sobre el inmenso patrimonio lingüístico del castellano y de las lenguas cooficiales. Queremos que la inteligencia artificial desarrollada en España sea inclusiva, transparente y útil para todos los sectores, apostando por una IA confiable, justa y orientada al beneficio colectivo. | Pública y abiertaALIA es una infraestructura 100% financiada con fondos públicos, lo que garantiza que su desarrollo y sus resultados estén al servicio del interés general. Su carácter abierto asegura la máxima transparencia, permitiendo que la comunidad investigadora pueda auditar y mejorar los modelos, que las empresas innoven y que la ciudadanía confíe en herramientas responsables. |
Resultados
A continuación se presentan los datasets, modelos y demostradores desarrollados por el grupo SINAI en el marco del proyecto ALIA.
Tres dominios de trabajo
BiosanitarioDesarrollo de conjuntos de datos y modelos para mejorar la comprensión y generación de informes clínicos y biomédicos. | Legal-administrativoRecursos lingüísticos orientados a trámites, documentos jurídicos y administrativos, facilitando el acceso ciudadano a la información pública. | Patrimonial-culturalModelos diseñados para la preservación, difusión y digitalización del patrimonio histórico y cultural. |