EVOCA Corpus

Tipo de recurso
Corpora
Descripción

EVOCA (English Version of OCA) es un corpus en inglés generado a partir de la traducción del corpus OCA en árabe. Este corpus contiene comentarios de películas y está dividido en 250 comentarios considerados positivos y 250 negativos. Algunas estadísticas sobre EVOCA corpus. Este corpus fue traducido en Abril de 2011. Algunas estadísticas sobre él se muestran en la siguiente tabla:

  Negativos Positivos
Total documentos 250 250
Total tokens 122.135 153.581
Media de tokens en cada comentario 488,54 614,32
Total sentencias 5.030 3.483
Media de sentencias en cada comentario 20,12 13,93

 

Cómo citar

Rushdi Saleh, M., Martín-Valdivia, M. T., Ureña-López, L. A. & Perea-Ortega, J. M. (2011). Bilingual Experiments with an Arabic-English Corpus for Opinion Mining. Proceedings of Recent Advances in Natural Language Processing, pages 740–745.

Para cualquier consulta sobre el corpus envía un email a Mohammed Saleh o José M. Perea

Archivos