La distanza di Mahalanobis è una misura di distanza statistica che generalizza il concetto di distanza euclidea nel caso di variabili correlate e con diverse scale di grandezza.
Definizione Matematica
Dato un punto (vettore) e una distribuzione con media e matrice di covarianza , la distanza di Mahalanobis è:
Perché è superiore alla distanza euclidea?
La distanza euclidea tratta ogni coordinata con lo stesso “peso” e ignora le correlazioni. La distanza di Mahalanobis, invece:
- Normalizza le scale: divide per la deviazione standard di ogni variabile.
- Decorrela le variabili: tiene conto del fatto che alcune variabili potrebbero variare insieme. In pratica, crea degli “ellissoidi di confidenza” attorno alla media: punti che hanno la stessa distanza di Mahalanobis sono egualmente probabili sotto una distribuzione normale multivariata.
Significato Ingegneristico
- Rilevamento di Outlier: In un sistema di monitoraggio industriale, un punto potrebbe avere coordinate che singolarmente sembrano normali, ma la cui combinazione è statisticamente impossibile. La distanza di Mahalanobis permette di identificare questi punti anomali.
- Classificazione (Pattern Recognition): Utilizzata nell’analisi discriminante lineare (LDA) per assegnare un nuovo campione alla classe “più vicina” in senso statistico.
- Ingegneria della Qualità: Monitoraggio di processi dove più variabili sono legate tra loro (es. pressione e temperatura in una caldaia); una variazione della sola pressione potrebbe essere normale, ma se non accompagnata dalla variazione attesa della temperatura, la distanza di Mahalanobis segnalerà un problema.
Vedi anche: Covarianza, Distanza Euclidea, Analisi delle Componenti Principali.