» REXIN: Construcción De Un Sistema De Recuperación Y Extracción De Información Multilingüe Con Interfaz Web

Ver ficha completa »

Desde 01 Enero 2004 hasta 31 Diciembre 2004
Referencia: FIT-340100-2004-14
Financiación: Ministerio de Ciencia y Tecnología (Proyecto PROFIT)
Entidades participantes: Universidad de Alicante y Universidad de Jaén
Coordinador: Mecanización de Empresas, S.A.

Extracción de información automática a partir de escrituras notariales y almacenarla en un soporte electrónico como una base de datos.

» Desarrollo De Sistemas De Recuperación De Información Multilingües: Técnicas Y Herramientas

Ver ficha completa »

Desde 01 Diciembre 2003 hasta 30 Noviembre 2006
Referencia: TIC2003-07158-C04
Financiación: Ministerio de Ciencia y Tecnología
Entidades participantes: Universidad de Jaén
Coordinador: L. Alfonso Ureña López

» Construcción De Un Sistema De Recuperación De Información Multilingüe A Través De La Web

Ver ficha completa »

Desde 01 Enero 2003 hasta 31 Diciembre 2003
Referencia: FIT-150500-2003-412
Financiación: Ministerio de Ciencia y Tecnología
Entidades participantes: Universidad de Jaén, Universidad de Alicante y Universidad de Sevilla
Coordinador: L. Alfonso Ureña López

» R2D2: Recuperación De Respuestas En Documentos Digitalizados

Ver ficha completa »

Desde 01 Diciembre 2003 hasta 30 Noviembre 2006
Referencia: TIC2003-07158-C04
Financiación: Ministerio de Ciencia y Tecnología (Proyecto CYCIT)
Entidades participantes:
Coordinador: Manuel Palomar Sanz

El objetivo principal del proyecto es la evaluación y desarrollo de sistemas de búsqueda de respuestas y recuperación de documentos en escenarios multilingües. Para ello se proponen dos líneas principales de actuación: La organización de la campaña internacional de evaluación multilingüe (CLEF) con el objetivo de proponer criterios y nuevas tareas relacionadas con el acceso a la información tanto para evaluar sistemas de acceso multilingüe como para estudiar aspectos interactivos de este tipo de tareas. El desarrollo de sistemas de acceso a la información (Sistemas de Búsqueda de Respuestas y Recuperación de Documentos) a través del estudio por un lado, de los aspectos multilingües e interactivos y, por otro, de la robustez de los sistemas en documentos escritos y transcritos.

» PROYECTO SRIM

Ver ficha completa »

Desde 01 Julio 2002 hasta 31 Diciembre 2003
Referencia: FIT-150500-2002-416 y FIT-150500-2003-412
Financiación: Ministerio de Ciencia y Tecnología (Proyecto PROFIT)
Entidades participantes: Universidad de Jaén, Universidad de Alicante
Coordinador: Dr. Antonio Ferrández Rodríguez

» LLaJú: Recuperación De Información Multilingüe

Ver ficha completa »

LlaJú es un sistema de Recuperación de Información Multilingüe basado en técnicas estadísticas. La demostración aquí implementada está preparada para operar sobre cinco idiomas pertenecientes a la Comunidad Europea, a partir de una consulta expresada necesariamente en el idioma inglés. La búsqueda se llevará a cabo sobre documentos escritos en alemán, español, francés, inglés e italiano. El corpus indexado está formado por más de un millón de noticias publicadas durante el año 1994 en diversas agencias de noticas y diarios (Der Spiegel, agencia EFE, Le Mode, Los Angeles Times, La Stampa, etc). Las consultas han de realizarse en inglés y serán traducidas a los distintos idiomas.

» WSD: Desambiguación Semántica En Inglés

Ver ficha completa »

SINAI WSD es un sistema de Desambiguación Semántica en Inglés basado en redes neuronales. La red que se usa es la LVQ entrenada con diversos recursos lingüísticos como Wordnet y Semcor. La convención que se va a seguir para la etiquetación es la siguiente: palabra\POS#SENTIDO, donde palabra es la palabra original, el POS es el Part Of Speech (1 si es un nombre, 2 si es un verbo, 3 si es un adjetivo y 4 si es un adverbio) y el SENTIDO es el número de sentido según WordNet 1.7. Como este servidor se encuentra compartido y alberga otros proyectos, el desambiguador está limitado a las 1500 palabras más frecuentes del inglés para reducir recursos.