IBM SkillsBuild/Matriz de confusion

La Matriz de Confusion: cuantas veces acierta y cuantas falla

Habeis creado un modelo de IA. Genial. Pero... como sabeis si es bueno o malo? Necesitais una tabla que os diga cuantas veces acierta y cuantas se equivoca. Esa tabla se llama Matriz de Confusion.

La tabla de aciertos y errores

Ejemplo: un modelo que predice si un alumno aprueba o suspende (95 alumnos en total)

Realidad: Aprobo
Realidad: Suspendio
Prediccion: Aprueba

45

Verdadero Positivo (VP)

Predijo APRUEBA y si aprobo

3

Falso Positivo (FP)

Predijo APRUEBA pero suspendio

Prediccion: Suspende

2

Falso Negativo (FN)

Predijo SUSPENDE pero aprobo

45

Verdadero Negativo (VN)

Predijo SUSPENDE y si suspendio

Traduccion: Lo verde es donde la IA acierta (bien!). Lo naranja y amarillo es donde falla (mal!). Queremos que los numeros gordos esten en las casillas verdes y los numeros peque en las otras.

Calculando la precision (que facil es)

Aciertos = VP + VN = 45 + 45 = 90

Total de alumnos = 95

Precision = 90 / 95 = 94.7%

Básicamente: de cada 100 alumnos, acierta con casi 95. Nada mal, no?

Ojo: no todos los fallos son iguales

Imaginad que la IA es un medico diagnosticando enfermedades. Un Falso Negativo significa que la IA le dice a alguien enfermo que esta sano. Esa persona se va a casa tranquila pensando que no le pasa nada... pero si le pasa. Eso puede ser muy peligroso.

En cambio, un Falso Positivo significa que le dice a alguien sano que esta enfermo. Susto, si, pero al hacerle mas pruebas se descubre que estaba bien. Es un error menos grave.

Por eso en medicina se prefiere "pecar de precavido" (mas falsos positivos) que "dejarse cosas" (falsos negativos).

Resumen rapido

VP/VN = aciertos (bien!)
FP/FN = errores (mal!)
No todos los errores son igual de graves. Depende del contexto.

Lo que teneis que recordar

La Matriz de Confusion es la tabla que os dice cuantas veces acierta y cuantas falla un modelo de IA. No basta con mirar el porcentaje general: hay que entender QUE TIPO de errores comete, porque en medicina un fallo puede costar una vida, pero en un filtro de spam solo os llega un email de mas.