La mamografía es la técnica de imagen de rutina utilizada ampliamente en los programas de cribado para la detección temprana del cáncer de mama. El principal marcador de riesgo de que una mujer desarrolle cáncer de mama es el Porcentaje de Densidad (PD) del tejido mamario. La densidad mamaria es una medición de cuánto tejido fibroso y tejido glandular (también referido como tejido fibroglandular) hay en la mama, en comparación con el tejido graso. Las mujeres con tejido mamario denso tienen un mayor riesgo de padecer cáncer de mama que las mujeres con tejido mamario menos denso.
La técnica comúnmente utilizada para la medición del PD es la segmentación manual del tejido denso mediante el ajuste de dos umbrales. Estos parámetros son ajustados por un radiólogo especialista mediante una herramienta como la desarrollada dentro de ITI denominada ITI Breast Calculate. Sin embargo, uno de los principales problemas de la segmentación manual es la alta variabilidad intra- e inter-observador existente. Por lo tanto, existe la necesidad de obtener un sistema automático capaz de realizar la segmentación del tejido denso y posterior cálculo del PD con la menor variabilidad posible. Además de la segmentación manual, ITI Breast Calculate incorpora un modelo basado en Inteligencia Artificial el cual estima automáticamente los dos umbrales de segmentación. Si bien este método funciona correctamente en la mayoría de los casos, hemos encontrado que el rendimiento decae cuando las mamografías provienen de dispositivos antiguos en donde la calidad de imagen es reducida. Dentro de la colaboración que llevamos a cabo junto con el Institut Hospital del Mar d’Investigacions Mèdiques (IMIM), ellos tenían la necesidad de segmentar mamografías de dispositivos antiguos para llevar a cabo un estudio longitudinal.
En un artículo publicado recientemente en Diagnostics presentamos un nuevo modelo de red neuronal para la segmentación automática del tejido denso. El modelo de IA, que denominamos CM-YNet, está basado en una aproximación de red neuronal convolucional con la salvedad de que modela un problema en el que no existe un gold-standard establecido. En este sentido, estima una máscara de segmentación de tejido denso, construye una matriz de confusión para cada uno de los especialistas ”etiquetadores” del corpus de entrenamiento y se actualizan los pesos del modelo tratando de minimizar una función que tiene en cuenta las matrices de confusión de todos los especialistas. Es decir, la red neuronal es capaz de aprender si una radióloga tiene tendencia a sub- o sobre-segmentar y mediante los pesos calculados se obtiene una estimación de la segmentación más próxima a lo que sería el gold-standard. Además, la aproximación contemplada, también estima los umbrales que permiten modificar las máscaras de segmentación para que, en caso de fallo del modelo, a través de la interacción con esos parámetros los especialistas puedan modificar el área estimada.
La arquitectura del modelo es la que se presenta en la Figura 1:
Figura 1: Arquitectura del modelo de Inteligencia Artificial desarrollado en ITI.
El dataset de imágenes utilizado para el entrenamiento del modelo CM-YNet son provenientes de 11 centros adscritos a un programa de cribado de cáncer de mama. Las imágenes cubren aproximadamente 1.500 pacientes y la mayoría de ellas tienen imágenes de una de sus mamas, tanto de vista cráneo-caudal como medio-lateral oblicua. Esto significa que el número total de imágenes utilizadas para entrenar el modelo es cercano a 2.800. Además, este corpus de imágenes fue segmentado por dos especialistas. La validación del sistema se ha realizado utilizando 1.225 imágenes también segmentadas por dos especialistas. Utilizando el DICE se midió el rendimiento del modelo comparado con la concordancia/acuerdo obtenido por las radiólogas.
Con este nuevo modelo se ha obtenido un DICE de 0,82 en el dataset de validación que incluye mamografías de dispositivos de adquisición antiguos, lográndose así una mejoría notable frente al desempeño del modelo anterior sobre los mismos datos con el que se consiguió un DICE de 0,73. Además, cabe resaltar que este modelo de segmentación automática tarda aproximadamente 5 segundos en procesar una mamografía, en comparación con la segmentación manual que puede estar del orden de los minutos dependiendo de la complejidad del caso. Sin embargo, la principal ventaja del modelo automático con respecto a la segmentación manual es la baja intra-variabilidad que presenta, es decir, sobre una misma imagen siempre se obtendrá el mismo resultado las veces que se procese.
El nuevo modelo desarrollado será incorporado dentro de la herramienta ITI BREAST Calculate y se utilizará para realizar una validación más exhaustiva de la herramienta en colaboración con el Institut Hospital del Mar d’Investigacions Mèdiques (IMIM). De esta manera, la herramienta desarrollada dentro de ITI se consolida dentro del ámbito de aplicación de la predicción de riesgo de cáncer de mama, siendo empleada por un usuario externo como parte de sus estudios longitudinales de validación.
Este trabajo se ha realizado en el marco del proyecto BIGSALUD, cuyo objetivo es aplicar técnicas basadas en IA y análisis de datos a distintas tareas relacionadas con la práctica clínica.