Tipo de recurso
Corpora
Descripción
EVOCA (English Version of OCA) es un corpus en inglés generado a partir de la traducción del corpus OCA en árabe. Este corpus contiene comentarios de películas y está dividido en 250 comentarios considerados positivos y 250 negativos. Algunas estadísticas sobre EVOCA corpus. Este corpus fue traducido en Abril de 2011. Algunas estadísticas sobre él se muestran en la siguiente tabla:
Negativos | Positivos | |
---|---|---|
Total documentos | 250 | 250 |
Total tokens | 122.135 | 153.581 |
Media de tokens en cada comentario | 488,54 | 614,32 |
Total sentencias | 5.030 | 3.483 |
Media de sentencias en cada comentario | 20,12 | 13,93 |
Cómo citar
Rushdi Saleh, M., Martín-Valdivia, M. T., Ureña-López, L. A. & Perea-Ortega, J. M. (2011). Bilingual Experiments with an Arabic-English Corpus for Opinion Mining. Proceedings of Recent Advances in Natural Language Processing, pages 740–745.
Para cualquier consulta sobre el corpus envía un email a Mohammed Saleh o José M. Perea
Archivos