Hermes-3-Llama-3.1-8B - SQAC_SQUAD_2024

ICM Norm
0.68
ICM Soft
0.68
system_description
Todas las tareas han sido convertidas a formato text-to-text. El prompt consiste en una descripción de la tarea y de 3 a 20 few-shot examples extraidos del train dependiendo de la tarea. El output de todas las tareas se ha convertido a formato JSON y se reprensenta mediante un objeto Pydantic. Usando la librería outlines forzamos al modelo a generar objetos JSON que complen la especificación Pydantic. El modelo ha sido finetuneado en formato multi-task (con todas las tareas al mismo tiempo).
Leaderboard Version
3
lang
es
metric
F1
error
No errors.
System
Hermes-3-Llama-3.1-8B
Results split
All
Source
Publication
F1
0.68
Accuracy
0.68
MacroF1
0.68
Pearson correlation
0.68
ICM
0.68