Inicio > Radiodiagnóstico y Radioterapia > Mejorando el Proceso de Ayres para la Detección de la Distorsión Arquitectural en Mamogramas > Página 4

Mejorando el Proceso de Ayres para la Detección de la Distorsión Arquitectural en Mamogramas

extracción de ROI’s con lesiones, se utilizaron las coordenadas proporcionadas por la base de datos en imágenes que presentan la lesión. Se obtuvieron un total de 25 ROI’s para falsos positivos (sin lesión) y un total de 18 ROI’s con distorsión arquitectural. Los segmentos de imágenes utilizadas (sub-imágenes conteniendo ROI’s) fueron de un tamaño de 128 x 128 pixeles. La figura 2 muestra ejemplos de ROI’s manejados en este trabajo. Debido a que no todas las características son relevantes para modelar la lesión, se aplicó un proceso de selección de las mismas a través del algoritmo Stepwise logistic regression (SLR) (Hosmer et al, 2000). SLR es un algoritmo secuencial de selección hacia delante que permite explorar el espacio original de las 14 características en busca de un subconjunto de las mismas que proporcione información significativa.

En este proceso se aplican modelos de regresión para determinar la importancia de una variable en el conjunto, utilizando estadísticos de máxima verosimilitud o equivalentes (mínimos cuadrados). Este algoritmo realiza dos pasos. Uno hacia adelante, para definir si una variable del conjunto aporta información significativa, si es así, formara parte del modelo, la forma de decidir es seleccionar la variable con el menor valor en el rango (0.05, 0.25). El siguiente paso, se le conoce como evaluación y es hacia atrás, en este paso, la variable que tenga el mayor valor en el rango de umbral (0.20, 0.90) se elimina. Este proceso continúa hasta que ya no hay más variables que evaluar o seleccionar.

El proceso de selección de características realizado por los autores da como resultado la selección de las siguientes variables: Entropía, Energía, Homogeneidad, Contraste y Correlación. Las variables seleccionadas se utilizarán como el vector de entrada para entrenar un clasificador basado en MVS. En esta etapa se utilizó el conjunto completo de ROI’s extraídas, tanto los verdaderos positivos como los falsos positivos, y se aplicó el algoritmo de GLCM con las 14 características de textura, dando un total de 44 datos de entrenamiento.

2.3. Clasificación de sitios potenciales

2.3.1 Clasificador basado en Máquina de Vectores de Soporte (MVS)

La siguiente etapa consiste en emplear un clasificador que ayude a eliminar los falsos positivos producidos en la fase de detección. Para este fin, se utiliza la técnica conocida como Máquina de Vectores de Soporte (MVS) (Vapnik, 1973). Las MVS han sido desarrolladas como una técnica robusta aplicadas en tareas de clasificación y regresión, y tienen la ventaja, de que pueden ser utilizadas para resolver tanto problemas lineales como no lineales. La idea principal consiste en construir un hiperplano de separación entre clases, de tal manera que el margen de separación entre las mismas sea máximo (hiperplano óptimo).

En nuestro caso se van a construir 2 MVS, una para reconocer falsos positivos, y otra para discriminar los falsos negativos. En la construcción del hiperplano se va a considerar el conjunto de entrenamiento especificado por  donde  representa en nuestro caso los vectores de entrada de 5 dimensiones. Este proceso se plantea como un problema de optimización de programación cuadrática con restricciones, indicado por:

Ver fórmula 13, en anexos

Donde  es la función kernel (*) utilizada. En este caso, una función lineal que opera como un discriminante. La forma de resolver este problema de optimización es aplicando multiplicadores de Lagrange, ya que de esta manera es posible representar el hiperplano buscado como una combinación lineal de los mismos datos, y no en términos de la base del espacio vectorial en que aparecen.

* Una función núcleo o kernel es un producto interno en el espacio de características que tiene su equivalente en el espacio de entrada.

2.3.2 Entrenamiento del modelo

Con el algoritmo de detección de sitios potenciales, se obtienen las coordenadas, en el mamograma bajo análisis, de regiones con alta probabilidad de contener la lesión de distorsión arquitectural. Tomando como centro las coordenadas proporcionadas, se crean ROI’s (ver Figura 6(e)) con un tamaño de 128 x 128 píxeles (se ha demostrado en varios trabajos relacionados, que este, es un tamaño de ROI apropiado para contener la lesión en su totalidad). Es a partir de estas ROI’s, de donde se obtienen las 5 características de Haralick (Entropía, Energía, Homogeneidad, Contraste y Correlación) antes mencionadas, y de ahí se genera el vector de características utilizado para entrenar el modelo basado en MVS. Por lo tanto, el vector de datos de entrada al MVS utilizado en este trabajo es un vector de 5 dimensiones.

El conjunto de datos proporcionados al MVS se obtuvieron a partir de 27 ROI’s, 15 de las cuales conteniendo información de falsos positivos (ver figura 2) y 12 con información de la lesión, es decir, verdaderos positivos (ver figura 2). De esta manera, el conjunto de datos proporcionados al modelo MVS consistió en un conjunto de 27 vectores de entrada con dos clases: i) verdaderos positivos y ii) falsos positivos.

Por lo tanto, se crean dos modelos de MVS: i) Un modelo MVS obtenido a partir de información proporcionada por ROI’s con lesión de distorsión arquitectural (verdadero positivo) y, ii) un modelo MVS creado con información de ROI´s con áreas del mamograma que no presentan lesión. La intención de crear dos modelos es con el fin de apoyar la decisión relacionada a, si una ROI generada en la etapa de detección, es o no, un verdadero positivo. El objetivo final consiste en reducir el número de falsos positivos.

2.3.3. Prueba del clasificador

Para verificar, la operación del clasificador, se utilizan imágenes de mamogramas no manejadas con anterioridad. En la figura 3 se ilustra el desarrollo del procedimiento para identificar regiones en un mamograma que pueden ser de interés al radiólogo. En este caso, regiones con indicios de ser distorsiones arquitecturales.

La explicación basada en la figura 3 es la siguiente: i) las ROI´s iniciales (figura 3(e)) se determinan una vez que se aplica el proceso de filtrado (figura 3(b)) y análisis de orientación de textura (figura 3(c)) en la imagen original (figura 3(a)), ii)