la selección de las características de textura se extraen de las ROI’s identificadas como verdaderos positivos (ver figuras 3(d) y 3(e)), iii) se forma el vector de características con información de los ROI’s (figura 3(e)), iv) se aplican los modelos basados en MVS con el fin de rechazar (no mostrar en el mamograma analizado) regiones identificadas como normales (sin distorsión arquitectural) o conservar (mostrar encerrado en rectángulos) los sitios identificados como distorsión arquitectural (ver figura 3(f)). Como se ilustra, se puede apreciar que el algoritmo de clasificación de sitios potenciales eliminó adecuadamente los falsos positivos, dejando sólo la ROI que contiene la lesión de distorsión arquitectural.
Este procedimiento se aplicó a un total de 43 imágenes extraídas de la base de datos MiniMIAS, de estas imágenes, 17 son catalogadas con distorsión arquitectural y 26 catalogadas como normales. Los resultados obtenidos indican una alta probabilidad (83%) en la detección de la lesión. Sin embargo, también muestra una elevada proporción de falsos positivos (38%). La Tabla 2 muestra los resultados de la prueba.
- Mejorando el proceso de detección de la distorsión arquitectural
Con la finalidad de reducir el costo computacional del algoritmo propuesto por Ayres y Rangayyan, se realizaron los siguientes pasos: i) determinar la etapa donde se concentra la mayor carga computacional, ii) reducir el tiempo de cómputo distribuyendo el procesamiento en varios núcleos. Las tareas realizadas en cada paso fueron las siguientes: Paso i). Se busca determinar si en alguna de las 2 etapas (detección, clasificación) se concentra una mayor carga computacional, o son relativamente equivalentes. Para esto, dividimos el cómputo en dos etapas: a) ejecución del algoritmo relacionado con el procesamiento y análisis del mamograma (tarea 1) y b) ejecución del algoritmo de clasificación (tarea 2). El equipo en que se ejecutaron estas tareas es una pc de escritorio, procesador Intel Core 2, 2.66 GHz, 4 GB de RAM, 2 MB en caché. Los tiempos de ejecución mostrados en la tabla 3 resultan de un promedio de tiempos calculados al repetir 10 veces el procesamiento de 8 mamogramas obtenidos de la base de datos miniMIAS.
Con esta información, confirmamos que el mayor tiempo de cómputo se destina en resolver los algoritmos utilizados durante el procesamiento y análisis del mamograma. Ayres y Rangayyan realizaron sus pruebas en una computadora de un núcleo. Por lo tanto, nos vamos a enfocar en aprovechar la potencia de una computadora multinúcleo con el fin de distribuir a los mismos, tareas relacionadas con el procesamiento del mamograma. Es decir, cada núcleo va a procesar, en paralelo, una parte de la imagen (ver figura 3), reduciendo con ello el tiempo total de procesamiento. El proceso que se realizó fue el siguiente: La imagen especificada por la ecuación (5), se divide en sub-imágenes, tantas como núcleos tenga la computadora donde se va a procesar. En nuestro caso, se utilizó una computadora con procesador Intel Core i7, con 4 núcleos de procesamiento, por lo tanto, la imagen se divide en 4 sub-imágenes (ver figura 4(a)). En cada sub-imagen se aplica el modelado de mapa de fase (ecuación (11)), seguido del cálculo del mapa de fase.
Posteriormente, las sub-imágenes resultantes se integran para generar la imagen final del mapa de fase (igura 4(b)). El tiempo de ejecución aplicando este proceso, junto al reportado por Ayres y Rangayyan se muestra en la Tabla 4. El tiempo mostrado por los autores en la Tabla 4 se obtuvo como un promedio de los tiempos obtenidos al procesar 8 mamogramas digitalizados 10 veces.
- Discusión y análisis de resultados
Este trabajo, aunque fue basado en la metodología propuesta por Ayres y Rangayyan, difiere un poco en alguna de las etapas del proceso, lo cual afecta los resultados obtenidos. Vamos a analizar los resultados alcanzados a partir de los siguientes puntos: i) características de los datos utilizados, ii) características utilizadas, obtenidas en el proceso de extracción y selección de características, iii) Características del clasificador.
i). Datos utilizados. Con respecto a los datos utilizados, Ayres y Rangayyan emplean en su trabajo mayormente mamogramas clasificados proporcionados por una institución de estudios biomédicos de Calgary, Canadá, la cual no es pública. La ventaja de usar esta información, es que disponen de una mayor cantidad de datos (106 imágenes correctamente clasificadas, 38 con distorsión arquitectural y 68 sin lesión) para entrenar su modelo y verificar su operación. Asimismo, las imágenes proporcionadas por esta institución son de una resolución menor (12 bits por píxel, 1300×800 píxels, aprox. 12 MB), en relación con las almacenadas en las bases de datos públicas, MIAS, DDSM, las cuales tienen un tamaño promedio de 35 MB. Una resolución menor y manteniendo la misma información, facilita el procesamiento. Asimismo, en la fase de detección utilizaron 2,821 ROI’s de 128×128 pixeles, obtenidas de 106 mamogramas, de los cuales 301 tienen distorsión y el resto no. Estas ROI’s también se utilizaron para la selección de características.
- ii) Características manejadas.
Ayres y Rangayyan, utilizaron los algoritmos de logistic regression y stepwise logistic regression para obtener sus características. Con estos algoritmos obtuvieron las siguientes: momento de diferencia inverso, suma de promedios, contraste, información de las medidas de correlación, homogeneidad y diferencia de entropía. En nuestro caso, también utilizamos el algoritmo stepwise logistic regression y obtuvimos las siguientes características: Entropía, Energía, Homogeneidad, Contraste y Correlación.
Como se puede observar, Ayres obtuvo un subconjunto de 6 características y los autores 5, donde solamente dos de las mismas (contraste y correlación) coinciden. Esta diferencia en las características seleccionadas puede deberse a varias razones: a) las cantidades de información utilizadas en este proceso son diferentes, mientras que Ayres y Rangayyan utilizaron 2, 821 ROI’s, los autores solamente 47, b) los autores emplearon un rango de umbral en el algoritmo para aceptar variables de [0.05, 0.20] y para rechazarlas de [0.21, 0.70], mientras que Ayres y Rangayyan emplearon un rango mayor ([0.05, 0.20] y [0.