Categorización de textos

La categorización de textos automática (Automated Text Categorization, ATC) consiste en la clasificación automática de documentos en categorías predefinidas.

Desambigüación léxica

La desambigüación (Word Sense Disambiguation, WSD) consiste en identificar el significado de una palabra en un determinado contexto dentro de un conjunto de candidatos determinado. La desambigüación no es un fin en sí misma, sino una tarea intermedia muy necesaria para algunas tareas del Procesamiento del Lenguaje Natural (PLN).

Búsqueda de respuestas

Se puede definir un Sistema de Búsqueda de Respuestas (QA) como aquel de forma automática tiene el fin de encontrar respuestas concretas a las necesidades de información requeridas por usuarios. Son sistemas muy útiles en los casos en que el usuario necesita conocer datos concretos y no quiere revisar toda la documentación referente al tema para conocer esos datos.

Recuperación de información monolingüe, multilingüe, distribuida

Los sistemas de recuperación de información (RI) se encargan de seleccionar y recuperar aquellos documentos que son relevantes para las necesidades de información requeridas por usuarios. Como resultado estos sistemas retornan una lista de documentos relevantes, normalmente ordenadas en función de unos valores que miden la validez de ese documento para responder a las necesidades de información del usuario.