Cómo la inteligencia artificial puede ayudar a prevenir el cáncer

Tiempo de lectura: 4 minutos

La tecnología y la salud

La ciencia y la tecnología avanzan a pasos agigantados y gracias a ello podemos prevenir y curar enfermedades que antes eran imposibles de tratar.
Es por ello que hoy hemos tenido el placer de charlar con Ferran Muiños, quién forma parte del método que busca prevenir el cáncer con la inteligencia artificial y el machine learning.

¿Quién es Ferran Muiños?

Matemático como primera formación, Ferran Muiños se especializó en las tecnologías  y métodos computacionales para el análisis de datos biológicos. Conjuntamente con Nuria Lopez-Bigas, Francisco Martínez-Jiménez, Oriol Pich, Abel Gonzalez-Perez; Ferran integra el equipo desarrollador del método BoostDM en el Institute for Research in Biomedicine (IRB Barcelona).

Ferran es co-primer autor del estudio publicado recientemente en la revista Nature donde se describe el método. El trabajo ha sido reconocido con el Premio Ciudad de Barcelona 2021 en la categoría de Ciencias de la Vida

¿Qué es BoostDM?

BoostDM nace como una prolongación natural del proyecto IntOGen (Integrative Oncogenomics), una herramienta web donde el usuario puede  navegar  por los resultados de un pipeline de análisis dedicado a identificar los genes responsables del desarrollo de tumores, también llamados drivers, analizados a partir de los datos de casi 30.000 muestras.

Estas muestras, han sido secuenciadas y procesadas inicialmente por grandes consorcios como: The Cancer Genome Atlas (TCGA) o el Pan-cancer Analysis of Whole Genomes (PCAWG).,

El sistema se nutre de los resultados de IntOGen y utiliza métodos de aprendizaje algorítmico (machine learning) para identificar las alteraciones genéticas causantes del desarrollo de un posible cáncer.

¿Cómo nutrir el Machine Learning?

Mediante un método de detección de variantes (variant calling), se procesan los datos brutos de secuenciación del genoma de las muestras biológicas(biopsias). Este paso identifica las letras del código genético que están alteradas en el tumor y distingue a las células tumorales de las células sanas del mismo paciente.

Una vez identificadas todas las mutaciones, se les asocian unas características predictivas o informativas para saber qué papel juegan en el desarrollo del tumor, y así, se añaden en el pipeline mediante un proceso de anotación.

Con la tecnología NextFlow, equivalente a la herramienta Snake del ecosistema Python,  se organizan los análisis en un pipeline. Un paso esencial es el entrenamiento de los modelos de aprendizaje algorítmico. Para ello es necesario etiquetar las mutaciones que sirven como ejemplo para que el método aprenda a reconocer patrones. Se proporcionan dos tipos de ejemplos: mutaciones drivers (responsables del desarrollo del tumor) y passengers (debidas al azar y no vinculadas al desarrollo del tumor)

¿Cuál ha sido el proceso más costoso de llevar a cabo?

Gracias a una metodología Gradient Boosting, un tipo de tecnología de aprendizaje automático para hacer supervised learning, el primer prototipo se obtuvo fácilmente.

Una vez establecido el método de aprendizaje, la parte más importante del proyecto consiste en validar que nuestros resultados y conclusiones no eran erróneas. Una manera de entender qué tienen en cuenta los modelos para generar sus predicciones basadas en reconocimiento de patrones, consiste en evaluar la importancia de cada feature predictiva. Para ello, Usamos una metodología conocida como SHAP (shapley additive explanations) uno de los métodos más robustos que existen en la actualidad. Usando SHAP podemos entender el por qué de estas predicciones.

Por otra parte, es muy importante validar las predicciones del método comparándolas con las evidencias experimentales que disponemos. Para ello entrenamos los modelos excluyendo ciertas mutaciones que han sido validadas experimentalmente y luego comprobamos si la predicción del modelo concuerda con los resultados experimentales.

La aplicación de BoostDM

Actualmente el uso de datos genómicos en la clínica es muy pequeño si lo comparamos con la cantidad de información que sabemos que se podría aprovechar de acuerdo con los estudios más recientes. Y la evaluación es poco sistemática. BoostDM se puede incorporar a herramientas generales de ayuda a la interpretación de variantes genéticas del cáncer, como el Cancer Genome Interpreter, arrojando de esta manera predicciones objetivas y sistemáticas.

Captura del método BoostDM, desrrollado en el Institute for Research in Biomedicine (IRB Barcelona).

De esta manera, podemos aplicar esta herramienta para ensayos clínicos de terapias dirigidas a variantes específicas del cáncer. Pero los resultados del estudio también nos permiten profundizar en aspectos básicos de la biología del cáncer. Los resultados de nuestros análisis con boostDM se pueden consultar en una web dedicada.

Inteligencia Artificial y Salud

No veo la IA como un sustituto de la labor humana, pero sí un aliado.
A medida que se vayan desarrollando nuevos y mejores sistemas de IA, esto nos permitirá mejorar nuestras capacidades de atención al paciente, acercándonos al objetivo de una medicina personalizada que tenga en cuenta las características específicas de la enfermedad de cada paciente.

Artículo por Guillem Sánchez, Marketing Specialist en Nuclio Digital School

Si eres de los que creen que el futuro son lo datos, tenemos un Máster para ti

Bootcamp Data Science

Si eres de los que creen que el futuro son lo datos, tenemos un Máster para ti

Bootcamp Data Science

Leave a Reply

Your email address will not be published.