» 20-Newsgroups

Ver ficha completa »

Tipo recurso:

Corpora

Descripción:

20000 mensajes tomados a partir de 20 grupos de noticias de Usenet. Disponible para uso científico

Enlace al recurso:

» AGFL

Ver ficha completa »

Tipo recurso:

Software para PLN y RI

Descripción:

Sistema para el desarrollo de gramáticas para el lenguaje natural y la generación automática de analizadores eficientes de tales gramáticas. Disponible para Windows y Unix
Licencia GNU GPL

Enlace al recurso:

» Apertium

Ver ficha completa »

Tipo recurso:

Software para PLN y RI

Descripción:

Traductor automático de código abierto para lenguas del Estado Español. Para 32-bit MSWindows (95/98/NT/2000/XP), POSIX (Linux/BSD/Unix OSes). Licencia GPL.

Enlace al recurso:

» Bayesian Logistic Regression Software

Ver ficha completa »

Tipo recurso:

Software para Machine Learning y Data Mining

Descripción:

Este software implementa Regresión Logística Bayesiana con dos opciones: Gaussian y Laplace (también conocido como doble exponencial). Libre para uso no comercial. Disponible para Windows y Linux

Enlace al recurso:

» Bayesian Multinomial Regression Software

Ver ficha completa »

Tipo recurso:

Software para Machine Learning y Data Mining

Descripción:

Este software pone en práctica Regresión Logística Bayesiana Multinomial. Libre para uso no comercial. Disponible para Windows y Linux

Enlace al recurso:

» BoosTexter

Ver ficha completa »

Tipo recurso:

Software para Machine Learning y Data Mining

Descripción:

Clasificador de texto basado en boosting. Puede manejar: múltiples atributos que pueden ser textuales, discretos o continuos, datos con atributos perdidos, problemas multiclase y grandes conjuntos de datos limpios. Licencia libre sólo para uso no comercial

Enlace al recurso:

» BOW

Ver ficha completa »

Tipo recurso:

Software para PLN y RI

Descripción:

Librería en C para modelado, recuperación y clasificación de textos. Para Unix y WindowsNT. Licencia LGPL

Enlace al recurso:

» CCG-NER

Ver ficha completa »

Tipo recurso:

Software para PLN y RI

Descripción:

Name Entity Tagging. Paquete que incorpora versiones de SNoW (red de clasificadores) y FEX, juntos con un módulo de inferencia. El resultado es un sistema robusta con buen funcionamiento sobre nuevos datos. Licencia libre para uso académico y de investigación.

Enlace al recurso:

» Collins Parser

Ver ficha completa »

Tipo recurso:

Software para PLN y RI

Descripción:

Analizador gramatical del lenguaje natural. GNU General Public License

Enlace al recurso:

» Collins Parser

Ver ficha completa »

Tipo recurso:

Software para PLN y RI

Descripción:

Analizador gramatical del lenguaje natural. GNU General Public License

Enlace al recurso:

» CoolTran

Ver ficha completa »

Tipo recurso:

Software para PLN y RI

Descripción:

Traductor de términos multiplataforma en diferentes idiomas. Dispone de varios diccionarios de idiomas preinstalados, aunque se pueden instalar más, y de una base de datos en internet “colaborativa”, a la que se conecta la aplicación. Implementación en Java. Licencia GPL

Enlace al recurso:

» Email SPAM ENRON Corpus

Ver ficha completa »

Tipo recurso:

Software para Machine Learning y Data Mining

Descripción:

Filtro de Spam con Naive Bayes

Enlaces relacionados:

» FIRE

Ver ficha completa »

Tipo recurso:

Software para PLN y RI

Descripción:

Flexible Image Retrieval Engine. Sistema de recuperación de imágenes. Dada una imagen como pregunta, el objetivo es encontrar las imágenes de una base de datos que son similares a la imagen dada. GNU Public Licence

Enlace al recurso:

» FOIL

Ver ficha completa »

Tipo recurso:

Software para Machine Learning y Data Mining

Descripción:

Algoritmo de aprendizaje inductivo de primer orden (First Order Inductive Learner). Se emplea para generar reglas de Asociación de Clasificación (CARs). Número máximo de tres atributos en el antecedente de una regla

Enlace al recurso:

» Freeling

Ver ficha completa »

Tipo recurso:

Software para PLN y RI

Descripción:

Librería que proporciona servicios para el análisis del lenguaje. Se puede usar como biblioteca externa o a través de una interfaz que permite analizar archivos desde línea de comandos. Algunas carácterísticas: tokenización de texto, división de oraciones, análisis morfológico, detección y clasificación de entidades, reconocimiento de fechas/números/dinero/proporciones, PoS tagging, Chart-based shallow parsing, detección de magnitudes físicas (velocidad, peso, temperatura, densidad, etc), anotación de sentido basado en Wordnet. Para español, catalán, italiano, gallego.

Enlace al recurso: