La matrice di confusione è una tabella che permette di visualizzare in modo dettagliato le prestazioni di un algoritmo di classificazione. Ogni riga della matrice rappresenta le istanze in una classe reale, mentre ogni colonna rappresenta le istanze in una classe prevista (o viceversa).
Struttura (Caso Binario)
In un problema con due classi (Positivo/Negativo), la matrice è :
| Previsto Negativo | Previsto Positivo | |
|---|---|---|
| Reale Negativo | Vero Negativo (TN) | Falso Positivo (FP) |
| Reale Positivo | Falso Negativo (FN) | Vero Positivo (TP) |
Definizioni Chiave
- Vero Positivo (TP): Il modello ha previsto correttamente la classe positiva.
- Vero Negativo (TN): Il modello ha previsto correttamente la classe negativa.
- Falso Positivo (FP): Il modello ha previsto positivo ma la realtà era negativa (Errore di Tipo I).
- Falso Negativo (FN): Il modello ha previsto negativo ma la realtà era positiva (Errore di Tipo II).
Perché è fondamentale?
La matrice di confusione è la fonte da cui vengono calcolate tutte le Metriche di Valutazione. Permette all’ingegnere di vedere immediatamente se il modello sta facendo “confusione” tra due classi specifiche, permettendo interventi mirati sui dati o sull’algoritmo.
Significato Ingegneristico
- Ispezione Automatica della Qualità: In una linea di produzione, la matrice aiuta a capire se il sistema di visione scarta troppi pezzi buoni (FP costosi) o se lascia passare troppi pezzi difettosi (FN pericolosi).
- Analisi dei Segnali: Nella rilevazione di un bersaglio (Radar), la matrice descrive la probabilità di “falso allarme” rispetto alla probabilità di “rilevamento”.
- Ottimizzazione del Modello: Analizzando la matrice di confusione su più classi (es. identificazione di 10 diversi tipi di guasto motore), è possibile capire se alcuni guasti sono fisicamente simili e quindi difficili da distinguere per il modello.
Vedi anche: Metriche di Valutazione (ML), Errore di Primo e Secondo Tipo.