Tipo de recurso
Corpus
Descripción
Conjunto de datos dispuesto en modo de benchmark para la evaluación de la capacidad de los modelos de lenguaje (LLMs) de razonar y responder preguntas sobre datos almacenados en tablas. Databench está compuesto por 65 conjuntos de datos tabulares procedentes de problemas reales.
Databench es resultado de la colaboración con Graphext y con CardiffNLP.
Cómo citar
Jorge Jorge Osés Grijalba and Luis Alfonso Ureña-López and
Eugenio Martínez Cámara and Jose Camacho-Collados. (2024). Question Answering over Tabular Data with DataBench: A Large-Scale Empirical Evaluation of LLMs. En Proceedings of LREC-COLING 2024, Turiín, Italia.
Enlace