Il coefficiente di correlazione (di Pearson), indicato con \rho o r, è un indice che misura la forza della relazione lineare tra due variabili aleatorie. A differenza della Covarianza, è un numero puro (adimensionale) e limitato.
Definizione
Si calcola dividendo la covarianza per il prodotto delle deviazioni standard delle due variabili: \rho_{XY} = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y}
Interpretazione dei Valori
Il valore di \rho è sempre compreso nell’intervallo [-1, 1]:
- \rho = 1: Correlazione lineare positiva perfetta (i punti giacciono su una retta con pendenza positiva).
- \rho = -1: Correlazione lineare negativa perfetta.
- \rho = 0: Assenza di correlazione lineare.
- 0.7 < |\rho| < 1: Correlazione forte.
Significato Ingegneristico
- Analisi Sperimentale: In laboratorio, si usa la correlazione per verificare se una variabile fisica (es. temperatura) influisce linearmente su un’altra (es. resistenza elettrica).
- Ingegneria del Software e Data Mining: La matrice di correlazione è il primo strumento usato per la selezione delle caratteristiche (feature selection): se due variabili sono fortemente correlate, una delle due potrebbe essere ridondante per il modello di previsione.
- Affidabilità di Sistemi Complessi: Permette di capire se il guasto di un componente è correlato al guasto di un altro (es. a causa di condizioni ambientali comuni). Una forte correlazione tra guasti riduce drasticamente l’efficacia della ridondanza.
Vedi anche: Covarianza, Regressione Lineare.