Los vocabularios controlados son recursos fundamentales para la extracción de información de textos clínicos mediante el procesamiento del lenguaje natural. Los recursos lingüísticos estándar disponibles en el ámbito sanitario, como el metatesauro UMLS o SNOMED-CT, se utilizan ampliamente para este fin, pero con limitaciones como la ambigüedad léxica de los términos clínicos. Sin embargo, la mayoría de ellos no son ambiguos dentro de un texto limitado a una determinada especialidad clínica. Esta es una razón, además de otras, para clasificar los textos clínicos por la especialidad clínica a la que pertenecen.
Este lexicón contiene una colección de términos médicos en español clasificados y ponderados por subdominio biomédico (especialidad clínica), utilizando como fuente de conocimiento los títulos y resúmenes de MEDLINE en español.
López-Úbeda, P., Pomares-Quimbaya, A., Díaz-Galiano, M. C., & Schulz, S. (2021). Collecting specialty-related medical terms: Development and evaluation of a resource for Spanish. BMC Medical Informatics and Decision Making, 21(1), 1-17.