OffendES_spans es un corpus en español creado a partir del corpus OffendES, con la identificación automática de términos ofensivos utilizando el lexicón SHARE. El corpus consta de 11.035 comentarios anotados con términos y expresiones ofensivos.
CONDICIONES DE USO:
- El recurso está disponible gratuitamente para fines de investigación.
- No se deben redistribuir los datos.
- SINAI declina toda responsabilidad por el uso del léxico y no proporciona soporte técnico. No obstante, los siguientes contactos estarán encantados de responder a las consultas y aclaraciones: fmplaza@ujaen.es, maite@ujaen.es.
Por favor, si usa el recurso, cite el siguiente artículo:
@inproceedings{plaza-del-arco-etal-2021-offendes,
title = "{O}ffend{ES}: A New Corpus in {S}panish for Offensive Language Research",
author = "Plaza-del-Arco, Flor Miriam and
Montejo-R{\'a}ez, Arturo and
Ure{\~n}a-L{\'o}pez, L. Alfonso and
Mart{\'\i}n-Valdivia, Mar{\'\i}a-Teresa",
booktitle = "Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP 2021)",
month = sep,
year = "2021",
address = "Held Online",
publisher = "INCOMA Ltd.",
url = "https://aclanthology.org/2021.ranlp-main.123",
pages = "1096--1108",
}