Fundamentos de Clasificación de Píxeles en Imágenes Digitales: Textura y Probabilidad

Conceptos Fundamentales en Clasificación de Imágenes

Primitivas

Regiones que poseen ciertos patrones en la distribución de los valores de nivel de gris.

Matriz de Co-ocurrencias Normalizada (MCN)

La matriz de co-ocurrencias normalizada, p(i,j), se define como aquella que se obtiene al dividir cada elemento de la matriz de co-ocurrencias P(i,j) por el número de transiciones totales.

Ejemplo de cálculo de contraste con MCN normalizada:

(0-0)² * (16/24) + (1-0)² * (2/24) + (1-1)² * ...

Energía Textural

Se obtiene mediante la convolución de la imagen con varios filtros o máscaras, produciendo tantas imágenes como convoluciones realizadas. Los filtros de energía indicados son:

  • Media ponderada (L)
  • Gradiente (E)
  • Forma (S)
  • Ondulación (W)
  • Rugosidad (R)
  • Oscilación (O)

Clasificación mediante el Método de Máxima Probabilidad

a) Asignación de píxeles con probabilidad a priori igual

Explica cómo asignarías un píxel de esa imagen a la clase X o a la clase Y considerando que ambas clases tienen la misma probabilidad a priori.

A partir de la ecuación de la función de densidad de probabilidad, se estimaría cuál es la probabilidad de que el píxel de la imagen pertenezca a la clase X o a la Y. En la ecuación siguiente, A es el nivel digital del píxel, y µx, σx son los estadísticos obtenidos de las muestras de aprendizaje de la clase X.

Del mismo modo, se haría con los valores de la clase Y. El píxel se asignará a aquella clase que tenga una probabilidad mayor.

b) Asignación de píxeles con probabilidad a priori diferente

Si la clase X ocupa el 70% de la superficie representada en la imagen y la clase Y el resto, indica cómo emplearías esta información en la clasificación.

Si sabemos que la superficie ocupada por los píxeles de la clase X es del 70% y la de la clase Y es el 30%, estos valores se pueden usar como probabilidades a priori. Por lo tanto, el valor de la probabilidad a posteriori (que es la que se maximiza en el método de máxima probabilidad) se obtendría multiplicando el valor obtenido para cada clase con la ecuación anterior por el valor de la probabilidad a priori: 0.7 en el caso de la clase X y 0.3 para la clase Y. Por lo tanto, el píxel se asignará a aquella clase con una mayor probabilidad a posteriori.

Métricas de Fiabilidad en la Clasificación

  • Fiabilidad Global: Suma de la diagonal / Total de píxeles.
  • Fiabilidad del Productor (Columnas): Píxeles correctos de una clase / Total de píxeles de esa clase (en la referencia).
  • Fiabilidad del Usuario (Filas): Píxeles correctos de una clase / Total de píxeles clasificados como esa clase.

Tipos de Muestreo

  • Aleatorio simple: La posición de cada observación es independiente de las demás.
  • Aleatorio estratificado: La imagen se divide en estratos o regiones, y en cada uno de ellos se realiza un muestreo aleatorio simple.
  • Sistemático: El muestreo se realiza situando puntos a intervalos regulares sobre la superficie.
  • Sistemático estratificado no alineado: Mezcla del método sistemático y el aleatorio estratificado.

Proceso de Clasificación Supervisada

  1. Selección de Clases: Descripción detallada de las clases de interés.
  2. Toma de Muestras: Recolección de Muestras de Aprendizaje (para entrenar el clasificador) y Muestras de Evaluación (para validar los resultados).
  3. Análisis de Separabilidad: Evaluar si las clases definidas pueden separarse con éxito y seleccionar las variables (bandas espectrales, índices, texturas) con mayor capacidad discriminatoria.
  4. Cálculo del Clasificador: Aplicación de distintos métodos para asignar los píxeles a las clases definidas. Algunos métodos comunes son:
    • Paralelepípedo
    • Mínima distancia
    • K vecinos más próximos (KNN)
    • Máxima probabilidad
  5. Asignación de Clases: Se calcula a qué clase corresponde cada píxel, después de elegir y entrenar el método de clasificación.
  6. Evaluación: Comparación entre el muestreo de campo (datos de referencia) y el resultado de la clasificación, utilizando el conjunto de muestras de evaluación. Se genera una Matriz de Errores (o Matriz de Confusión).
  7. Coeficiente Kappa: Cálculo de un índice estadístico que mide la proporción en la reducción del error al aplicar la clasificación, respecto al error que se hubiera producido con una asignación aleatoria.

Clasificación por Máxima Probabilidad (Imagen Monobanda)

Se desea clasificar un píxel x en las clases A, B o C utilizando una única banda de la imagen.

a) Datos necesarios

¿Qué datos necesitas conocer para poder asignar el píxel a una clase?

Necesitamos conocer la media (µ) y la desviación típica (σ) de cada clase (A, B y C) en la banda considerada. Además, necesitamos el nivel digital del píxel x en esa misma banda.

b) Aplicación de fórmulas con probabilidades a priori

¿Cómo aplicarías las fórmulas para asignar el píxel x a una clase, teniendo en cuenta que la clase A tiene el doble de probabilidad a priori que las clases B y C?

Primero, con la fórmula de la función de densidad de probabilidad (generalmente asumiendo una distribución normal), calculamos el valor de dicha función para el píxel x respecto a la clase A, luego para B y finalmente para C. Estos valores representan la verosimilitud P(x|Clase).

Luego, introducimos estos valores en la fórmula del Teorema de Bayes para obtener la probabilidad a posteriori de pertenencia del píxel x a cada clase: P(Clase|x) ∝ P(x|Clase) * P(Clase).

Es necesario también fijar las probabilidades a priori P(Clase). Como se indica en el enunciado, la clase A tiene el doble de probabilidad a priori que B y C. Si asumimos que solo existen estas tres clases, la suma de sus probabilidades debe ser 1. Por lo tanto: P(A) = 0.5, y P(B) = P(C) = 0.25.

El píxel x se asignará a aquella clase que tenga una mayor probabilidad a posteriori.

Clasificación No Supervisada

Búsqueda de agrupaciones naturales (clusters) de píxeles en el espacio de características, sin aportación de información auxiliar (muestras de entrenamiento). Algoritmos comunes incluyen C-medias (K-Means) e ISODATA.

Divergencia

Medida estadística utilizada para evaluar la separabilidad de las clases espectrales, tomadas de dos en dos. Cuantifica el grado de solape entre sus distribuciones de probabilidad en el espacio de características.