Distanza di Mahalanobis

Indice dei contenuti

    La distanza di Mahalanobis è una misura di distanza statistica che generalizza il concetto di distanza euclidea nel caso di variabili correlate e con diverse scale di grandezza.

    Definizione Matematica

    Dato un punto (vettore) x\mathbf{x} e una distribuzione con media μ\boldsymbol{\mu} e matrice di covarianza Σ\boldsymbol{\Sigma}, la distanza di Mahalanobis DMD_M è: DM(x)=(xμ)TΣ1(xμ)D_M(\mathbf{x}) = \sqrt{(\mathbf{x} - \boldsymbol{\mu})^T \boldsymbol{\Sigma}^{-1} (\mathbf{x} - \boldsymbol{\mu})}

    Perché è superiore alla distanza euclidea?

    La distanza euclidea tratta ogni coordinata con lo stesso “peso” e ignora le correlazioni. La distanza di Mahalanobis, invece:

    1. Normalizza le scale: divide per la deviazione standard di ogni variabile.
    2. Decorrela le variabili: tiene conto del fatto che alcune variabili potrebbero variare insieme. In pratica, crea degli “ellissoidi di confidenza” attorno alla media: punti che hanno la stessa distanza di Mahalanobis sono egualmente probabili sotto una distribuzione normale multivariata.

    Significato Ingegneristico

    • Rilevamento di Outlier: In un sistema di monitoraggio industriale, un punto potrebbe avere coordinate che singolarmente sembrano normali, ma la cui combinazione è statisticamente impossibile. La distanza di Mahalanobis permette di identificare questi punti anomali.
    • Classificazione (Pattern Recognition): Utilizzata nell’analisi discriminante lineare (LDA) per assegnare un nuovo campione alla classe “più vicina” in senso statistico.
    • Ingegneria della Qualità: Monitoraggio di processi dove più variabili sono legate tra loro (es. pressione e temperatura in una caldaia); una variazione della sola pressione potrebbe essere normale, ma se non accompagnata dalla variazione attesa della temperatura, la distanza di Mahalanobis segnalerà un problema.

    Vedi anche: Covarianza, Distanza Euclidea, Analisi delle Componenti Principali.

    Ultimo aggiornamento: