Rango de interpretación del radiólogo en un programa de cribado de 1 millón de mamografías digitales.

15/10/2020

Artículo original: Salim M, Dembrower K, Eklund M, Lindholm P, Strand F. Range of Radiologist Performance in a Population-based Screening Cohort of 1 Million Digital Mammography Examinations. Radiology 2020; 297:33-39

DOI: https://doi.org/10.1148/radiol.2020192212   @radiology_rs

Sociedad: Radiological Society of North America (RSNA).

Palabras clave: breast cancer, cancer detection, digital breast tomosynthesis, digital mammography, screening, artificial intelligence, computer-aided detection, radiologist.

Abreviaturas y acrónimos utilizados: CAD (detección asistida por computadora), IA (inteligencia artificial), FFDM (mamografías digitales de campo completo).

Línea editorial del número: Radiology es una de las revistas oficiales de Radiological Society of North America (RSNA) con mayor factor de impacto de la imagen médica. Publica mensualmente artículos originales y de revisión. En este número se publican varios artículos de neuro-radiología, de imagen cardíaca, de resonancia magnética, y músculo-esquelética, en concreto y 6 artículos acerca del COVID-19, de libre acceso.

Y me ha parecido relevante un artículo de Sankatsing et al. que es un estudio de la relación coste-efectividad de realizar la tomosíntesis de mama en el programa de cribado poblacional en el que concluyen que  resulta rentable tanto en Europa como en Estados Unidos. U.S.

Motivos para la selección: Por el interés que existe en desarrollar CAD basados en IA para la detección del cáncer de mama en mamografías.

Resumen: Los programas de detección del cáncer de mama ofrecen importantes beneficios para la salud, pero pese a que los costes generales son sustanciales debido al gran número de participantes. Para mejorar el rendimiento del cribado, se ha desarrollado el CAD para facilitar la detección de tumores en mamografías de cribado. Sin embargo, el  CAD clásico, basado en fórmulas especificadas programadas por humanos para la identificación de tumores, da como resultado muchos un elevado número de falsos positivos. Existe un optimismo creciente con el uso de métodos de análisis de imágenes basados en IA para alcanzar el nivel humano de interpretación en la detección de los hallazgos sospechosos en las mamografías.

Los sistemas CAD de IA pueden aumentar el rendimiento del diagnóstico y reducir los costes. Pero antes de que estos puedan implementarse clínicamente, deben validarse y comparar su rendimiento con el de los radiólogos. 

El objetivo de este estudio es establecer puntos de referencia de rendimiento a nivel humano, para compararlos con sistemas de CAD de IA independientes como reemplazo del primer lector en una serie basada en la población definida geográficamente de alrededor de 1 millón de mamografías.

Se trata de un estudio multicéntrico retrospectivo realizado con FFDM obtenidas durante el control de cribado. La población de estudio fueron todas las mujeres de 40 a 74 años de Estocolmo que participaban en el programa de cribado de 2008 a 2015. La duración del estudio fue de 18 a 24 meses, con una participación del 70%. De los 110 radiólogos participantes, se distingue diferenciamos entre lectores de bajo y alto volumen, según el número de mamografías de detección anuales, aproximadamente más o menos de 5000 mamografías en 1 año.

El protocolo estándar en El sistema de detección de Suecia incluye una mamografía de 2 proyecciones de cada mama evaluada con doble lectura (2 radiólogos). Si uno o ambos radiólogos observan un hallazgo sospechoso, se procederá a un consenso y si concluye en sospecha radiológica se recitará a la mujer. Otro motivo por el cual se recita a una paciente  es cuando ésta informa de síntomas en el momento que se le realiza la mamografía. 

Se determinó determinaron los niveles de actuación de cada radiólogo para los siguientes valores: sensibilidad, especificidad, tasa de interpretación anormal, tasa de detección de cáncer, tasa de falsos negativos, precisión y valor predictivo positivo. Para facilitar las futuras evaluaciones de los sistemas CAD de IA, se describieron niveles de sensibilidad específicos en función de las para varias características tumorales: subtipo molecular, tipo histológico (incluido el tamaño del tumor) y la capacidad de invasión. 

Los puntos de referencia mostraron una amplia gama de diferencias de rendimiento entre lectores de gran volumen. La sensibilidad oscila en relación a las características del tumor. También reveló un número menor de falsos negativos en el primer lector.

En conclusión, el estudio evidenció una variedad de puntos de referencia que pueden ser útiles para evaluar el rendimiento y elegir el funcionamiento independiente de los sistemas de detección asistida  por computadora  basados en inteligencia artificial.  Para reemplazar la lectura doble y la discusión de consenso, los requisitos son más altos que simplemente reemplazar al primer lector.

Valoración personal: Pese a las dificultades que conlleva la interpretación de la estadística y su lenguaje. Según se desprende del estudio Parece que el CAD-IA puede ser una buena solución para ayudar en la lectura de las mamografías de cribado pero quizás se podría plantear un nuevo papel  para el técnico radiólogo como uno de los dos lectores, tal y como vienen desempeñando en el Reino Unido y en Australia.

 

 Cecilia Aynes Suárez

Parc Taulí Hospital  Universitari  (Sabadell), TSIDMN

 caynes@tauli.cat   

@CAynes4