ICM Norm
0.81
ICM Soft
0.81
system_description
Todas las tareas han sido convertidas a formato text-to-text. El prompt consiste en una descripción de la tarea y de 3 a 20 few-shot examples extraidos del train dependiendo de la tarea. El output de todas las tareas se ha convertido a formato JSON y se reprensenta mediante un objeto Pydantic. Usando la librería outlines forzamos al modelo a generar objetos JSON que complen la especificación Pydantic. El modelo ha sido finetuneado en formato multi-task (con todas las tareas al mismo tiempo).
Leaderboard Version
3
lang
es
metric
ICMNorm
error
No errors.
Sistema
Gemma-2B-IT
Partición resultados
All
F1
0.81
Accuracy
0.81
MacroF1
0.81
Pearson correlation
0.81
ICM
0.81