Diagnostico mediante IA sería efectivo como el de un profesional médico
Después de hacer su aparición en el mundo informático, el aprendizaje profundo, cada vez adquiere mayor relevancia en el campo de la inteligencia artificial (IA). Esta subcategoría del aprendizaje automático trata sobre el uso de redes neuronales, es decir la organización de un sistema de programas y datos estructurados que se asemeja al funcionamiento del cerebro humano.
En los últimos años, el aprendizaje profundo ha ayudado en la identificación de imágenes de diagnóstico médico, campo en que las computadoras pueden examinar miles de estas imágenes para identificar patrones de enfermedad.
Este enorme potencial tecnológico puede mejorar enormemente la precisión y la velocidad del diagnóstico, puesto que se ha observado que los informes de modelos de aprendizaje profundo pueden llegar a superar a los humanos en las pruebas de diagnóstico, hecho que ha generado gran entusiasmo y debate a la vez.
En Estados Unidos existen más de 30 algoritmos de IA para la atención médica que han sido aprobados por la Administración de Alimentos y Medicamentos de los Estados Unidos (FDA), pero existe solo un pequeño número de estudios de elevada calidad sobre el tema que se pueden revisar, por lo que el verdadero poder de la IA sigue siendo incierto y los investigadores exigen investigaciones e informes de más alto nivel para optimizar las evaluaciones futuras y determinar en qué grado los hallazgos son aplicables a la práctica clínica real.
Calidad de los estudios
Para proporcionar más evidencia con respecto al uso de la IA en el diagnóstico de enfermedades a través del uso de imágenes médicas, un grupo de investigadores realizaron una revisión sistemática y un metanálisis, sintetizando toda la evidencia disponible de la literatura científica, investigación que fue publicada en la revista The Lancet Digital Health.
Este estudio revisó todos los estudios que compararon el desempeño de los modelos de aprendizaje profundo y los profesionales de la salud en la detección de enfermedades de imágenes médicas publicadas entre enero de 2012 y junio de 2019. También evaluaron el diseño del estudio, la calidad de los informes y su valor clínico.
Solo unos pocos estudios fueron de calidad suficiente para ser incluidos en el análisis, como explica el profesor Alastair Denniston de University Hospitals Birmingham NHS Foundation Trust, Reino Unido, quien dirigió la investigación:
“Revisamos más de 20,500 artículos, pero menos del 1% de estos fueron lo suficientemente sólidos en su diseño e informaron que los revisores independientes tenían una gran confianza en sus reclamos. Lo que es más, solo 25 estudios validaron los modelos de IA externamente (usando imágenes médicas de una población diferente), y solo 14 estudios en realidad compararon el desempeño de IA y profesionales de la salud usando la misma muestra de prueba«.
IA, diagnóstico médico y limitaciones
El análisis de datos de 14 estudios que compararon el desempeño del aprendizaje profundo con el diagnóstico hecho por humanos en la misma imagen encontró que, en el mejor de los casos, los algoritmos de aprendizaje profundo pueden detectar correctamente la enfermedad en el 87% de los casos, en comparación con el 86% logrado por los profesionales.
La capacidad de excluir con precisión a los pacientes sanos también fue similar para los algoritmos de aprendizaje profundo (93% de especificidad) en comparación con los profesionales de la salud (91%).
Como Denniston resume:
“Dentro de esos pocos estudios de alta calidad, encontramos que el aprendizaje profundo podría detectar enfermedades que van desde cánceres hasta enfermedades oculares con la misma precisión que los profesionales de la salud. Pero es importante tener en cuenta que la IA no superó sustancialmente el diagnóstico humano”.
Hay que destacar que los autores señalan varias limitaciones en los estudios incluidos, aspectos que incluyen la metodología y el informe de los estudios de diagnóstico de IA, como el hecho que el aprendizaje profundo se evaluó habitualmente de forma aislada, sin considerar la información clínica adicional, que normalmente se emplea como un complemento importante para hacer un diagnóstico en la práctica clínica.
La Dra. Livia Faes del Hospital Moorfields Eye, Londres, opina sobre el futuro de la IA en el diagnóstico y la importancia en la obtención de indicadores claves sobre la salud pública:
«La evidencia sobre cómo los algoritmos de IA cambiarán los resultados del paciente debe provenir de comparaciones con pruebas de diagnóstico alternativas en ensayos controlados aleatorios«, “Hasta el momento, apenas existen ensayos de este tipo en los que se toman decisiones diagnósticas tomadas por un algoritmo de IA para ver qué sucede con los resultados que realmente importan a los pacientes, como el tratamiento oportuno, el tiempo de alta hospitalaria o incluso las tasas de supervivencia«.