Matrice definita positiva

Indice dei contenuti

    Una matrice definita positiva è una matrice reale simmetrica, oppure complessa hermitiana, la cui forma quadratica associata è strettamente positiva in ogni direzione non nulla. È una classe centrale in algebra lineare, ottimizzazione, statistica, metodi numerici e modelli energetici.

    Nel caso reale si considera una matrice simmetrica A=A^T e si richiede:

    \mathbf{x}^T A\mathbf{x}>0 \qquad \text{per ogni } \mathbf{x}\ne\mathbf{0}.

    Nel caso complesso si richiede che A sia hermitiana, cioè A=A^*, e:

    \mathbf{x}^*A\mathbf{x}>0 \qquad \text{per ogni } \mathbf{x}\ne\mathbf{0}.

    Si scrive spesso A\succ0. La condizione di simmetria o hermitianità non è un dettaglio: la definitezza positiva riguarda la parte della matrice che genera una forma quadratica reale.

    Criteri equivalenti

    Per una matrice reale simmetrica, le seguenti condizioni sono equivalenti:

    CriterioCondizione
    Forma quadratica\displaystyle \mathbf{x}^TA\mathbf{x}>0 per ogni \displaystyle \mathbf{x}\ne0
    Autovaloritutti gli autovalori di \displaystyle A sono positivi
    Criterio di Sylvestertutti i minori principali di testa sono positivi
    Choleskyesiste \displaystyle A=LL^T con \displaystyle L triangolare inferiore e diagonale positiva
    Norma indotta\displaystyle \sqrt{\mathbf{x}^TA\mathbf{x}} è una norma

    Il criterio di Sylvester è pratico per matrici piccole o simboliche; la fattorizzazione di Cholesky è il test numerico naturale nei calcoli con matrici dense o sparse; il teorema spettrale spiega perché gli autovalori controllano il segno della forma quadratica.

    Esempio in dimensione 2

    Per una matrice simmetrica:

    A= \begin{pmatrix} a & b\\ b & c \end{pmatrix},

    la definitezza positiva equivale a:

    a>0, \qquad \det A=ac-b^2>0.

    Per esempio:

    \begin{pmatrix} 2 & 1\\ 1 & 2 \end{pmatrix} \succ0,

    perché 2>0 e il determinante vale 3>0.

    Al contrario:

    \begin{pmatrix} 1 & 2\\ 2 & 1 \end{pmatrix}

    ha diagonale positiva, ma determinante -3 e autovalori 3 e -1: è indefinita. Questo esempio mostra perché guardare solo gli elementi diagonali non basta.

    Semidefinita positiva e indefinita

    Una matrice è semidefinita positiva se:

    \mathbf{x}^T A\mathbf{x}\ge0 \qquad \text{per ogni } \mathbf{x}.

    Si scrive A\succeq0. In questo caso può esistere un vettore non nullo per cui \mathbf{x}^TA\mathbf{x}=0, quindi la matrice può essere singolare. Una matrice di covarianza è sempre semidefinita positiva; è definita positiva solo quando nessuna combinazione lineare non banale delle variabili ha varianza nulla.

    Se la forma quadratica assume sia valori positivi sia valori negativi, la matrice è indefinita. Se invece \mathbf{x}^TA\mathbf{x}<0 per ogni \mathbf{x}\ne0, la matrice è definita negativa.

    Significato geometrico e numerico

    Una matrice definita positiva definisce una norma indotta:

    \lVert \mathbf{x}\rVert_A = \sqrt{\mathbf{x}^TA\mathbf{x}}.

    Le superfici di livello:

    \mathbf{x}^TA\mathbf{x}=1

    sono ellissi o ellissoidi centrati nell’origine. Gli autovettori di A danno le direzioni principali; gli autovalori positivi determinano quanto la forma cresce lungo quelle direzioni.

    Dal punto di vista numerico, le matrici definite positive sono favorevoli: permettono Cholesky senza pivoting, garantiscono energia positiva, evitano direzioni di curvatura negativa e sono il caso naturale per il gradiente coniugato. Se però gli autovalori positivi sono molto piccoli, la matrice può essere definita positiva ma mal condizionata.

    Dove compare

    AmbitoRuolo della definitezza positiva
    ottimizzazioneuna Hessiana definita positiva indica minimo locale stretto
    minimi quadratimatrici normali regolarizzate diventano SPD
    statisticacovarianze non degeneri e distanza di Mahalanobis
    elementi finitimatrici di rigidezza di sistemi ben vincolati
    controllofunzioni di Lyapunov quadratiche V(x)=x^TPx con P\succ0
    probabilità gaussianamatrici di covarianza invertibili

    Nella distanza di Mahalanobis, per esempio, serve una matrice di covarianza invertibile:

    d_M(x,\mu)^2 = (x-\mu)^T\Sigma^{-1}(x-\mu).

    Se \Sigma\succ0, allora anche \Sigma^{-1}\succ0 e la quantità è positiva per ogni x\ne\mu.

    Errori comuni

    Il primo errore è controllare solo che gli elementi diagonali siano positivi. È una condizione necessaria, ma non sufficiente: contano anche i termini fuori diagonale e il segno in tutte le direzioni.

    Il secondo errore è applicare criteri per matrici simmetriche a matrici non simmetriche senza prima chiarire quale forma quadratica si sta usando. Per una matrice reale generica M, la quantità \mathbf{x}^TM\mathbf{x} dipende solo dalla parte simmetrica:

    \mathbf{x}^TM\mathbf{x} = \mathbf{x}^T \left( \dfrac{M+M^T}{2} \right) \mathbf{x}.

    Il terzo errore è confondere definita positiva e semidefinita positiva. Una matrice semidefinita positiva può essere singolare, quindi non sempre è invertibile e non sempre ammette Cholesky classica con diagonale strettamente positiva.

    Il quarto errore è ignorare la scala numerica: una matrice teoricamente definita positiva ma quasi singolare può causare instabilità, fattorizzazioni sensibili e soluzioni poco affidabili.

    Vedi anche: forma quadratica, criterio di Sylvester, fattorizzazione di Cholesky, teorema spettrale, matrice di Gram, autovalore, Hessiana, matrice di covarianza, gradiente coniugato e formulario di algebra lineare e geometria.

    Ultimo aggiornamento: