Léxicon

SOL

Tipo recurso:

Lexicón

Descripción:

SOL es una lista de palabras indicadoras de opinión en español independiente del dominio.

Para la elaboración del recurso se ha partido de la lista de palabras que mantiene el profesor Bing Liu (Bing Liu’s Opinion Lexicon). La lista de palabras ha sido traducida automáticamente usando el traductor Reverso.

La lista está formada por 1.397 palabras positivas y por 3.151 negativas. Para más información sobre como se ha desarrolla la lista puede consultar el artículo: Bilingual Experiments on an Opinion Comparable Corpus (in press).

Martínez-Cámara, E., Martín-Valdivia, M. T., Molina-Gonzalez, M. L. & Alfonso Ureña-López, L. (2013). Bilingual Experiments on an Opinion Comparable Corpus. Proceedings of the 4th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis
http://aclweb.org/anthology/W13-1612

Archivos del recurso:

sol.tar.gz

iSOL

Tipo recurso:

Lexicón

Descripción:

iSOL es una lista de palabras indicadoras de opinión en español independiente del dominio.

Para la elaboración del recurso se ha partido de la lista de palabras que mantiene el profesor Bing Liu (Bing Liu’s Opinion Lexicon). La lista de palabras ha sido traducida automáticamente usando el traductor Reverso y posteriormente se han corregido manualmente.

La lista está formada por 2.509 palabras positivas y por 5.626 negativas. Para más información sobre como se ha desarrolla la lista puede consultar el artículo: Semantic Orientation for Polarity Classification in Spanish Reviews.

Referencia:

Si utiliza el recurso, por favor, cite el siguiente artículo:

Molina-González, M. D., Martínez-Cámara, E., Martín-Valdivia, M. T., & Perea-Ortega, J. M. (2013). Semantic orientation for polarity classification in Spanish reviews. Expert Systems with Applications, 40(18), 7250-7257.

Archivos del recurso:

isol.tar.gz

eSOL

Tipo recurso:

Lexicón

Descripción:

eSOL es una lista de palabras indicadoras de opinión en español dependientes del dominio. El dominio del conjunto de palabras es el de críticas de cine.

Para la elaboración de la lista se ha seguido un enfoque basado en corpus. En este caso se ha seleccionado el corpus de críticas de cine en español Spanish Movie Reviews. La lista está formada por 2.535 palabras positivas y 5.639 palabras negativas. Para más información sobre como se ha elaborado la lista puede consultar el artículo: Semantic Orientation for Polarity Classification in Spanish Reviews (In revision).

Molina-González M.D., Martínez-Cámara, E., Martín-Valdivia, M. T. & Perea-Ortega, J. M. (2012). Semantic orientation for polarity classification in Spanish reviews. Expert Systems with Applications.
http://dx.doi.org/10.1016/j.eswa.2013.06.076

Archivos del recurso:

esol.tar.gz

CRiSOL

Tipo de recurso:

Lexicón

Descripción:

CRiSOL es el resultado de la combinación de dos recursos lingüísticos destinados al Análisis de Opiniones. Uno de esos recursos es la lista de palabras de opinión en español iSOL, y el otro es el lexicón de opinión en inglés SentiWordNet. El resultado ha sido un filtrado de SentiWordNet a partir de los términos de iSOl, así como un recurso en que cada palabra tiene dos fuentes de información, las cuales se pueden aprovechar conjuntamente o por separado.

CRiSOL cuenta con las 8135 entradas de iSOL, de las cuales 4434 tienen asociado además el valor de polaridad de SentiWordnet.

Cómo citar:

Molina González, M. Dolores, Martínez Cámara, Eugenio, & Martín Valdivia, M. Teresa. (2015). CRiSOL: Base de Conocimiento de Opiniones para el Español. Procesamiento Del Lenguaje Natural, 55, 143-150.
http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5226

Archivos del recurso:

crisol.tar.gz

emoti-sp

Tipo de recurso:

Lexicón

Descripción:

Recurso para investigación en Análisis de Opiniones.  El léxico está compuesto por 70 emoticonos positivos, y por 46 emoticonos negativos.

Archivos del recurso:

Para obtener el recurso, previamente tiene que enviar un correo a Salud M. Jiménez Zafra (sjzafra@ujaen.es) o a Eugenio Martínez Cámara (emcamara@ujaen.es).

Hashtags-sp

Tipo de recurso:

Lexicón

Descripción:

Recurso para investigación en Análisis de Opiniones sobre tweets en español. El léxico está compuesto por 172 hashtags positivos, y por 127 hashtags negativos.

Archivos del recurso:

Para obtener el recurso, previamente tiene que enviar un correo a Salud M. Jiménez Zafra (sjzafra@ujaen.es) o a Eugenio Martínez Cámara (emcamara@ujaen.es).

eSOLdomainGlobal

Tipo recurso:

Lexicón

Descripción:

Uno de los principales problemas del Análisis de Opiniones es la generación de recursos adaptados a un dominio concreto. eSOLdomainGlobal es un conjunto de listas de palabras indicadoras de opinión en español que abarcan 8 dominios distintos: coches, hoteles, lavadoras, libros, teléfonos móviles, música, ordenadores y películas. Las listas se han generado a partir del lexicón iSOL, y siguiendo un método basado en corpus tomando la versión española del corpus SFU Review Corpus se han generado las 8 listas.

Palabras

Positivas

Negativas

Coches

2528

5648

Hoteles

2517

5636

Lavadoras

2520

5639

Libros

2529

5651

Móviles

2529

5657

Música

2538

5645

Ordenadores

2527

5644

Películas

2535

5648

Archivos del recurso:

eSOLdomainGlobal.rar