ICM Norm
0.53
ICM Soft
0.53
system_description
Todas las tareas han sido convertidas a formato text-to-text. El prompt consiste en una descripción de la tarea y de 3 a 20 few-shot examples extraidos del train dependiendo de la tarea. El output de todas las tareas se ha convertido a formato JSON y se reprensenta mediante un objeto Pydantic. Usando la librería outlines forzamos al modelo a generar objetos JSON que complen la especificación Pydantic. El modelo ha sido finetuneado en formato multi-task (con todas las tareas al mismo tiempo).
Leaderboard Version
3
lang
es
metric
Macro F1-score
error
No errors.
Sistema
Gemma-2B-IT
Partición resultados
All
F1
0.53
Accuracy
0.53
MacroF1
0.53
Pearson correlation
0.53
ICM
0.53