En el mundo de la radiología, la innovación tecnológica está transformando la manera en que se analizan y utilizan los datos clínicos. Un reciente estudio titulado «Leveraging Transformers-based models and linked data for deep phenotyping in radiology» ha explorado el uso de modelos basados en transformadores y datos enlazados para el fenotipado profundo en radiología. Este avance promete mejorar significativamente la precisión y eficiencia en la investigación clínica y la atención médica personalizada.
Contexto y objetivo del estudio
El estudio, publicado en la revista Computer Methods and Programs in Biomedicine, aborda un desafío común en la reutilización de datos clínicos: la gran cantidad de texto libre en los registros electrónicos de salud (EHRs). A pesar de los esfuerzos por normalizar y estandarizar estos registros, el texto libre sigue siendo la norma en muchas notas clínicas, lo que dificulta la investigación clínica que depende de datos estructurados y terminologías clínicas.
Metodología innovadora
Para abordar este problema, los investigadores utilizaron modelos de procesamiento de lenguaje natural (NLP) basados en transformadores, específicamente modelos preentrenados de RoBERTa. Estos modelos procesaron informes de radiología y los etiquetaron con terminología biomédica, mapeando estos conceptos a varias ontologías biomédicas. El resultado fue una base de conocimiento enlazada (LKB) que permite ejecutar consultas expresivas para recuperar informes que cumplan con criterios específicos mediante razonamiento automático.
Resultados destacados
El enfoque propuesto permite construir bases de conocimiento escalables utilizando ontologías estándar de la web de datos. Los informes de radiología en español fueron procesados y etiquetados automáticamente, facilitando la ejecución de consultas de fenotipado profundo. Este método es especialmente valioso en sistemas regionales y nacionales que manejan grandes bases de datos de investigación de diferentes registros y cohortes.
Conclusión y futuro
El estudio demuestra que la combinación de tecnologías NLP y datos enlazados permite construir bases de conocimiento escalables y ejecutar consultas de fenotipado profundo de manera efectiva. Aunque la mayoría de las herramientas de fenotipado se basan en bases de datos relacionales, este enfoque ofrece una alternativa viable y escalable para la reutilización de datos clínicos no estructurados.
Este avance en el procesamiento de textos clínicos subraya la importancia de la innovación en la investigación y la atención médica personalizada, abriendo nuevas posibilidades para el futuro de la radiología y la medicina en general.