Un vettore aleatorio \mathbf X\in\mathbb R^d ha distribuzione normale multivariata se ogni combinazione lineare a^T\mathbf X è normale univariata. Questa caratterizzazione è coerente con il teorema di Cramér-Wold, che riconosce una legge vettoriale attraverso tutte le sue proiezioni lineari.
La notazione standard è:
dove \boldsymbol\mu=\mathbb E[\mathbf X] è il vettore delle medie e \Sigma=\operatorname{Cov}(\mathbf X) è la matrice di covarianza. La matrice \Sigma deve essere simmetrica e semidefinita positiva; se è definita positiva, la distribuzione ammette densità rispetto alla misura di Lebesgue.
Se \Sigma è definita positiva, la densità è
Il termine quadratico:
è la distanza di Mahalanobis al quadrato. Le superfici di densità costante sono ellissoidi centrati in \boldsymbol\mu; assi e allungamenti dipendono da autovalori e autovettori di \Sigma.
Le marginali e le condizionate sono ancora gaussiane. Questa chiusura rende la normale multivariata centrale in regressione lineare, filtri di Kalman, processi gaussiani, analisi multivariata e propagazione di incertezza. Nel caso normale multivariato, incorrelazione e indipendenza delle componenti coincidono: se due componenti hanno covarianza nulla, allora sono indipendenti. Questa proprietà non vale per distribuzioni generiche.
Se \Sigma è singolare, la distribuzione è degenere: il vettore vive su un sottospazio affine di dimensione minore di d e non possiede una densità ordinaria in tutto \mathbb R^d. Il caso è importante quando alcune variabili sono combinazioni lineari esatte di altre.
Un errore frequente è identificare “marginali normali” con “normale multivariata”. Avere componenti singolarmente normali non basta: devono essere normali tutte le combinazioni lineari.
Vedi anche: Matrice di covarianza, Covarianza, Matrice definita positiva, Vettore aleatorio, Teorema di Cramér-Wold, Convergenza congiunta.