Científicos de Weill Cornell Medicine y el Dana-Farber Cancer Institute de Boston han desarrollado y probado nuevas herramientas de inteligencia artificial (IA) adaptadas a la patología digital, un campo en rápido crecimiento que utiliza imágenes digitales de alta resolución creadas a partir de muestras de tejido para ayudar a diagnosticar enfermedades y guiar el tratamiento.
Su artículo, publicado en *The Lancet Digital Health* el 9 de julio, demuestra que ChatGPT, un modelo de lenguaje de IA desarrollado para comprender y generar texto, puede ser adaptado para proporcionar respuestas precisas a preguntas sobre patología digital y compilar resultados detallados. Los autores también descubrieron que ChatGPT puede ayudar a los patólogos sin una amplia experiencia en codificación a utilizar software complejo que analiza muestras de tejido, lo que ayuda a cerrar la brecha entre las habilidades de patología y patología digital.
ChatGPT es un modelo de lenguaje extenso (LLM), lo que significa que genera texto sobre una amplia gama de temas utilizando grandes cantidades de datos. “Los LLM son buenos para tareas generales, pero no son las mejores herramientas para obtener información útil para campos especializados”, dijo el autor principal del estudio, Dr. Mohamed Omar, profesor asistente de investigación en patología y medicina de laboratorio y miembro de la División de Patología Computacional y de Sistemas en Weill Cornell Medicine. Dr. Luigi Marchionni, profesor asociado de patología y medicina de laboratorio y jefe de la División de Patología Computacional y de Sistemas, también es coautor de este estudio.
Para crear herramientas de IA que pudieran aumentar la eficiencia y la precisión necesarias para la toma de decisiones matizadas necesaria en la patología digital, el autor correspondiente, Dr. Renato Umeton, director de Operaciones de Inteligencia Artificial y Servicios de Ciencia de Datos, Departamento de Informática y Análisis de Dana-Farber, encabezó el esfuerzo para personalizar ChatGPT.
Impulsar la precisión de la IA para la patología
“Los LLM generales tienen dos problemas principales. Primero, a menudo proporcionan respuestas genéricas largas que no contienen información útil”, dijo el Dr. Omar. “Segundo, estos modelos pueden alucinar e inventar cosas de la nada, incluidas las citas bibliográficas. Esto es especialmente malo en campos especializados como la patología digital y la biología del cáncer, por ejemplo”.
Para abordar los fallos, el Dr. Umeton comenzó con una versión segura, privada y protegida de ChatGPT implementada en el Dana-Farber Cancer Institute (GPT4DFCI). Los investigadores aumentaron GPT4DFCI con acceso a una base de datos completa y seleccionada de los últimos desarrollos en patología digital, que constaba de 650 publicaciones a partir de 2022, lo que sumó más de 10.000 páginas de literatura.
“Podríamos pedirle a este nuevo sistema que nos pusiera al día sobre muchos temas o técnicas específicas en patología digital y obtener resultados en segundos, con un nivel de detalle, profundidad y resumen que no existe en las herramientas de literatura científica o motores de búsqueda actuales”, dijo el Dr. Umeton.
Utilizaron una técnica llamada generación aumentada por recuperación (RAG), que permitió a GPT4DFCI acceder a documentos o información relevantes de esta base de datos especializada y generar respuestas precisas a las indicaciones del usuario sobre patología digital, pero nada fuera de ese ámbito.
El Dr. Omar y sus colegas compararon las respuestas de GTP4DFCI con las proporcionadas por el modelo GPT-4 más general. Al exigir a GTP4DFCI que proporcionara enlaces a las publicaciones específicas que utilizó para generar respuestas, determinaron que las respuestas eran precisas y fundamentadas. El modelo refinado proporcionó respuestas más precisas y relevantes que GPT-4 y no alucinó ni una sola vez.
“Espero que esto sea un catalizador para más herramientas específicas del dominio en otros campos de la medicina o la investigación médica”, dijo el Dr. Omar.
La IA proporciona una mano amiga con la codificación
El segundo programa de IA que desarrolló el equipo ayuda a los patólogos a utilizar PathML, una biblioteca de software especializada que requiere familiaridad con el lenguaje de programación Python para analizar conjuntos de datos de imágenes de histopatología vastos y complejos. “Los patólogos o científicos sin experiencia previa en codificación a menudo encuentran muy difícil utilizar PathML para tareas de análisis de imágenes”, dijo el Dr. Omar.
Los investigadores integraron PathML con ChatGPT, lo que permite a los usuarios simplemente escribir sus preguntas sobre la ejecución de análisis de histopatología con PathML. La herramienta luego proporciona instrucciones precisas paso a paso sobre la codificación de sus muestras.
“Nuestra investigación muestra que, cuando se combina con las técnicas de recuperación de información adecuadas, ChatGPT y herramientas de IA seguras, como GPT4DFCI, pueden ser extremadamente efectivas para apoyar a los investigadores básicos”, dijo el Dr. Umeton. “Estas herramientas son útiles incluso en temas muy complejos que necesitan respuestas extremadamente precisas, como la patología digital”.
Este trabajo fue apoyado por las subvenciones del Instituto Nacional del Cáncer P50CA211024, P01CA265768 y U54CA273956.
Revista
The Lancet Digital Health
Fecha de publicación del artículo
9-Jul-2024