OffendES_spans: Un corpus en español para la identificación del términos ofensivos

Descripción

OffendES_spans es un corpus en español creado a partir del corpus OffendES, con la identificación automática de términos ofensivos utilizando el lexicón SHARE. El corpus consta de 11.035 comentarios anotados con términos y expresiones ofensivos.

CONDICIONES DE USO:

  • El recurso está disponible gratuitamente para fines de investigación.
  • No se deben redistribuir los datos.
  • SINAI declina toda responsabilidad por el uso del léxico y no proporciona soporte técnico. No obstante, los siguientes contactos estarán encantados de responder a las consultas y aclaraciones: fmplaza@ujaen.es, maite@ujaen.es.

 

Cómo citar

Por favor, si usa el recurso, cite el siguiente artículo:

@inproceedings{plaza-del-arco-etal-2021-offendes,
    title = "{O}ffend{ES}: A New Corpus in {S}panish for Offensive Language Research",
    author = "Plaza-del-Arco, Flor Miriam  and
      Montejo-R{\'a}ez, Arturo  and
      Ure{\~n}a-L{\'o}pez, L. Alfonso  and
      Mart{\'\i}n-Valdivia, Mar{\'\i}a-Teresa",
    booktitle = "Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP 2021)",
    month = sep,
    year = "2021",
    address = "Held Online",
    publisher = "INCOMA Ltd.",
    url = "https://aclanthology.org/2021.ranlp-main.123",
    pages = "1096--1108",
}