EXIST-2023: Source Intention (soft-soft)

Esta tarea pretende clasificar los tuits sexistas según la intención del autor, lo que permite comprender el papel que desempeñan las redes sociales en la emisión y difusión de mensajes sexistas. En esta tarea, se propone una clasificación ternaria: direct, reported, judgemental.

En esta tarea se contempla una evaluación soft-soft en la que se compara la probabilidad de cada etiqueta predicha por el sistema con la probabilidad definida a partir del desacuerdo en la anotación en el gold standard.
 

Publicación
Plaza, L. et al. (2023). Overview of EXIST 2023 – Learning with Disagreement for Sexism Identification and Characterization. In: Arampatzis, A., et al. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2023. Lecture Notes in Computer Science, vol 14163. Springer, Cham. https://doi.org/10.1007/978-3-031-42448-9_23
Idioma
Español
NLP topic
Tarea abstracta
Año
2023
Métrica Ranking
ICM

Mejores resultados para la tarea

Sistema Precisión Recall F1 Ordenar ascendente CEM Accuracy MacroPrecision MacroRecall MacroF1 RMSE MicroPrecision MicroRecall MicroF1 MAE MAP UAS LAS MLAS BLEX Pearson correlation Spearman correlation MeasureC BERTScore EMR Exact Match F0.5 Hierarchical F ICM MeasureC Propensity F Reliability Sensitivity Sentiment Graph F1 WAC b2 erde30 sent weighted f1
Xlm roberta large 0.4414 0.4414 0.4414 0.4414 0.44
XLM-RoBERTa-large-2 0.4384 0.4384 0.4384 0.4384 0.44
XLM-RoBERTa-large-v3 0.4384 0.4384 0.4384 0.4384 0.44
Hermes-3-Llama-3.1-8B_2 0.4378 0.4378 0.4378 0.4378 0.44
Hermes-3-Llama-3.1-8B 0.4364 0.4364 0.4364 0.4364 0.44
Xlm roberta base 0.4245 0.4245 0.4245 0.4245 0.42
PlanTL GOB ES roberta large bne 0.4237 0.4237 0.4237 0.4237 0.42
Dccuchile bert base spanish wwm cased 0.4182 0.4182 0.4182 0.4182 0.42
PlanTL GOB ES roberta base bne 0.4173 0.4173 0.4173 0.4173 0.42
CenIA distillbert base spanish uncased 0.4160 0.4160 0.4160 0.4160 0.42