DataBench

Tipo de recurso
Corpus
Descripción

Conjunto de datos dispuesto en modo de benchmark para la evaluación de la capacidad de los modelos de lenguaje (LLMs) de razonar y responder preguntas sobre datos almacenados en tablas. Databench está compuesto por 65 conjuntos de datos tabulares procedentes de problemas reales.

Databench es resultado de la colaboración con Graphext y con CardiffNLP.

Cómo citar

Jorge Jorge Osés Grijalba and Luis Alfonso Ureña-López and
Eugenio Martínez Cámara and Jose Camacho-Collados. (2024). Question Answering over Tabular Data with DataBench: A Large-Scale Empirical Evaluation of LLMs. En Proceedings of LREC-COLING 2024, Turiín, Italia.

Enlace