El corpus inglés EXIST 2023 es una colección de tuits etiquetados con información relacionada con el sexismo: si el tweet es sexista, el tipo de intención que muestra el autor del tuit y el tipo de sexismo que se está ejerciendo.
Idioma(s)
Inglés
Enlace descripción Dataset
Año
2023
Dominio
Social
Tipo Textos
Tuits
Anotaciones
Etiqueta binaria indicando si un tuit expresa sexismo, etiquetas multiclase sobre el tipo de sexismo y etiquetas multiclase sobre la intención del autor.
Formato
json
Acceso a datos
Registro
Enlace acceso a datos
Publicación
Plaza, L. et al. (2023). Overview of EXIST 2023 – Learning with Disagreement for Sexism Identification and Characterization. In: Arampatzis, A., et al. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2023. Lecture Notes in Computer Science, vol 14163. Springer, Cham. https://doi.org/10.1007/978-3-031-42448-9_23
Enlace publicación
NLP Topic
Número de unidades
4152
Tipo de unidades
Tuits
Tamaño set entrenamiento
2870
Tamaño set evaluación
838
Tamaño set desarrollo
444
- Inicie sesión o registrese para enviar comentarios